当前位置: 首页 > news >正文

专业做网站服务国内免费可商用图片素材网站

专业做网站服务,国内免费可商用图片素材网站,居然之家设计家官网,wordpress 下列主题不完整_没有主题样式表和模板.xpath是python做数据解析的库 目录 1 安装 2 解析本地的html文件 2.1 只有一个标签的情况 2.2 有多个标签的情况 3 解析网上的页面 4 xpath表达式 4.1 绝对路径 4.2 两个斜杠表示中间隔了0级或多级 4.3 通过属性查找 4.4 通过索引查找 4.5 获取文本内容…

xpath是python做数据解析的库

目录

1  安装

2  解析本地的html文件

2.1  只有一个标签的情况

2.2  有多个标签的情况

3  解析网上的页面

4  xpath表达式

4.1  绝对路径

4.2  两个斜杠表示中间隔了0级或多级

4.3  通过属性查找

4.4  通过索引查找

4.5  获取文本内容

4.6  获取属性

4.7  或运算

5  xpath返回的对象使用xpath

6  常见错误

6.1  存在没闭合的标签


1  安装

pip install lxml

2  解析本地的html文件

2.1  只有一个标签的情况

比如我想找到test.html中的title

xpath()中接的是xpath表达式,xpath就和linux中的路径一样,先是html然后是head最后找到title

由于title只有一个,所以返回的结果列表中只有一个title对象

2.2  有多个标签的情况

比如我现在想找到这两个div

3  解析网上的页面

4  xpath表达式

4.1  绝对路径

4.2  两个斜杠表示中间隔了0级或多级

可以表示0级

也可以表示多级

由于两个斜杠表示多级,所以一开始的html也没必要写了

4.3  通过属性查找

比如我找这个

再比如我找这个

4.4  通过索引查找

上面我是对tree.xpath()返回的列表进行索引,我们也可以直接写在xpath表达式中,比如我找第二个div

  • xpath表达式是从第1个算的,不算从第0个算的

4.5  获取文本内容

上面我是在外部使用的text,你也可以在里面使用text(),比如我想获得所有div的文本内容

text()只能拿到直系的文本内容,隔一层就拿不到了

如果你写 //text() 就可以拿到了

4.6  获取属性

比如我想取所有div的something属性值

只有一个div有something这个属性,所以只显示一个

换一个属性也一样,比如class

4.7  或运算

比如我现在想那 span或div 的内容

5  xpath返回的对象使用xpath

6  常见错误

6.1  存在没闭合的标签

我现在想找这个title

那我可以这样写

运行后会报错

这个错误的原因就是有没闭合的标签,比如这里的meta

我们需要闭合这里的标签

|然后再运行就可以了

http://www.yayakq.cn/news/965922/

相关文章:

  • 深圳做网站需要多少钱整站快速排名
  • 梅州兴宁网站建设培训建站公司主要做那些业务
  • 公司制作网站费用备案多个网站
  • 全能网站建设教程wordpress 手机发文章
  • 自微网站为女朋友做的表白网站
  • 建设银行无锡分行网站内江网站制作
  • 沈阳网站建设 成创商标logo一键生成器
  • 有哪些好的响应式网站有哪些网站分析seo情况
  • 帝国建站软件织梦做的网站如何修改
  • 中企动力网站报价网站建设留言板
  • 做网站用什么软件?网站建设 印花税
  • 怎样做网站卖东西贵州住建局和城乡建设官网
  • 长安外贸网站建设公司上海网站建设 虹口
  • 怎么做付费网站做网站不推广有效果吗
  • 京网站制作公司网页设计需要学什么知识
  • 运城门户网站建设怎么做自动发卡的网站
  • 游戏网站wordpress优秀网页设计作品分析ppt
  • 南通网站定制网站去哪里备案
  • 东莞市电商网站建设优秀企业网站模板
  • 做我女朋网站源码360收录批量查询
  • 图片瀑布流网站模板酒店如何做好线上营销
  • 把自己的电脑做网站服务器山东城市建设职业学院教务网网站
  • 企业网站官网yy直播间
  • 济南手机端建站模板100深夜看黄禁用免费
  • 温州网站建设结构医疗网站建设 中企动力
  • 公司做竞拍网站的收入怎么报税双语网站建设方案
  • html文档模板做网站优化的公司的宣传海报
  • 用帝国做网站好做吗流量推广平台有哪些
  • 做网站需要提供什么资料网站配色 蓝绿
  • 手机怎么做销售网站哪里有培训网页设计