当前位置: 首页 > news >正文

长沙市城市建设档案馆网站齐齐哈尔铁峰建设局网站

长沙市城市建设档案馆网站,齐齐哈尔铁峰建设局网站,搜索引擎优化教材答案,dw做aspx网站文章目录 导入模块相关语法实战 导入模块 from lxml import etree相关语法 XPath(XML Path Language)是一种用于在XML文档中定位和选择元素的语言。XPath的主要应用领域是在XML文档中进行导航和查询,通常用于在XML中选择节点或节点集合。以…

在这里插入图片描述

文章目录

  • 导入模块
  • 相关语法
  • 实战

导入模块

from lxml import etree

相关语法

XPath(XML Path Language)是一种用于在XML文档中定位和选择元素的语言。XPath的主要应用领域是在XML文档中进行导航和查询,通常用于在XML中选择节点或节点集合。以下是XPath的基本语法和一些常见的表达式:

  1. 节点选择:

    • /: 从根节点开始选择
    • //: 选择节点,不考虑它们的位置
    • .: 当前节点
    • ..: 父节点
  2. 节点过滤:

    • [@attribute='value']: 选择具有特定属性值的节点
    • [position()]: 选择特定位置的节点
    • [last()]: 选择最后一个节点
    • [text()='some text']: 选择具有特定文本内容的节点
  3. 通配符:

    • *: 匹配任何元素节点
    • @*: 匹配任何属性节点
  4. :

    • ancestor::: 选择所有祖先节点
    • descendant::: 选择所有子孙节点
    • parent::: 选择父节点
    • child::: 选择子节点
    • following-sibling::: 选择后续同级节点
    • preceding-sibling::: 选择前置同级节点
  5. 运算符:

    • and: 逻辑与
    • or: 逻辑或
    • not: 逻辑非
  6. 函数:

    • text(): 选择当前节点的文本内容
    • name(): 选择当前节点的名称
    • count(): 计算节点集合的节点数
    • concat(): 连接字符串

以下是一些XPath表达式的示例:

  • /bookstore/book: 选择所有直接子节点为book的节点
  • //book: 选择文档中所有的book节点
  • /bookstore/book[@category='fiction']: 选择具有特定属性值的book节点
  • //title[text()='Introduction to XPath']: 选择具有特定文本内容的title节点
  • /bookstore/book[position()<3]: 选择前两个book节点
  • //author[contains(text(),'Rowling')]: 选择包含特定文本的author节点

XPath语法灵活且强大,可以根据需要进行深入的定位和选择。

实战

  • 解析的话,我们是对网站的发送的请求所传回的对象的text 进行解析
  • 对于xpath 进行寻找得到,加上text()就可以输出文本
  • 对于xpath 查找的得到的,加上@属性名 就可以返回相关的属性值
  • 为了使用方便,常常用//来选择结点,用[@ class = " "]来具体根据属性筛选,对于同一个路径下,多个平行的内容,可以在[@ class = " "]之后加上[ number]来具体选择,注意,这个number 为具体第几个,从1开始
  • 注意xpath 返回的对象为列表

以网站https://ssr1.scrape.center/为例子
我们先爬取该网站的电影名字
在这里插入图片描述
通过看网页的源码,发现在

标签下,class = “m-b-sm”
在这里插入图片描述

import requests
from lxml import etreeheaders ={"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}responce = requests.get(r'https://ssr1.scrape.center/',headers = headers)html = etree.HTML(responce.text)allname = html.xpath(r'//h2[@class="m-b-sm"]/text()')
for name in allname:print(name)

这样就可以爬取电影名

在这里插入图片描述

http://www.yayakq.cn/news/496211/

相关文章:

  • 网站建设用什么语言个人营业执照网上注销流程
  • 平面设计网站知乎制作个人网页详细教程
  • 重庆市建设工程信息网站南平购物网站开发设计
  • 网站建设药店局域网内部网站建设app下载
  • wordpress mysql分离深圳百度首页优化
  • 西安市建设工程交易中心网站梦幻西游网页微信版
  • 常州市住房和城乡建设局网站成都网站建设推广在线咨询
  • 小程序开发平台网站推荐建筑类期刊排名
  • 规范网站建设情况的报告有哪些可以做问卷赚钱的网站
  • 卡盟怎么做网站网站建设栏目分析
  • 怎么建立一个个人网站搜索引擎营销的过程
  • 一个网站需要多少网页wordpress淘宝客手机
  • 北京网站sem、seowordpress模板作者怎样去除
  • 电商网站开发工程师物流加盟信息网站
  • 产品设计网站制作微友圈推广平台怎么加入
  • 百度收录率高的网站用心做电影的网站
  • ireal 网站建设中国建设银行招聘信息网站
  • 做网站的背景怎么做外贸网站如何做的好
  • 定制网站和模板网站有何区别耒阳市做网站的
  • 本地建设网站软件设计公司企业文化
  • 廊坊企业网站排名优化杭州最大网络公司排名
  • iis7配置网站404页面做网站用什么比较好
  • 用html5做的音乐网站全国失信被执行人名单查询
  • 聊城手机站网站公司电话网站建设制作确认单
  • 外国网站怎么进入html5手机网站源码下载
  • 公司做网站还是做阿里好呢衡水网站建设格公司
  • 淄博服装网站建设html5动态效果的网站是怎么做的
  • 用html5做网站的心得体会惠州外发加工网
  • 塑胶托盘东莞网站建设做直播网站开发教程
  • 营销型网站是什么龙华住房和建设局网站官网