当前位置: 首页 > news >正文

研学网站平台建设方案南京注册公司有什么要求

研学网站平台建设方案,南京注册公司有什么要求,北京市网页设计,西安的网站制作公司有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。 用F12看一下网页源代码,对应上图表格内容的部分如下: 使用python和lxml来定位爬取。 首先要安装lxml,如下命令(可以…

有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。

用F12看一下网页源代码,对应上图表格内容的部分如下:

 

使用python和lxml来定位爬取。

首先要安装lxml,如下命令(可以在pycharm项目的Terminal中运行):

pip3 install lxml

实现代码:

from lxml import etree
import requestsurl = 'https://www.example.com'
r = requests.get(url)
result = r.text
html = etree.HTML(result)rows = html.xpath(".//div[@class='table-responsive fpl-list']/table/tbody/tr[position()>0]")proxy_list = []
for row in rows:td_list1 = row.xpath('./td[1]')td_list2 = row.xpath('./td[2]')ip = td_list1[0].text.replace(' ','').replace('\t','').replace('\n','')port = td_list2[0].text.replace(' ','').replace('\t','').replace('\n','')web_proxy = {'ip': ip, 'port': port, 'types': 0, 'protocol': '0', 'country': '0', 'area': '0', 'speed': 100}proxy_list.append(web_proxy)print(proxy_list

说明:

在HTML中,tr、td、th是用于构建表格的核心标签‌:tr(Table Row)定义表格行,td(Table Data)定义标准数据单元格,th(Table Header)定义表头单元格。‌‌

结合上述代码,rows即是获取的表格中的所有行。

然后针对每一行进行操作。从每一行中,定位并获取需要的单元格的文本内容(此行第一列的单元格就是td[1],第二列就是td[2],使用.text获取其文本内容,注意:使用row.xpath获取出的是一个列表,需要加一个[0]来成为单个元素)。

http://www.yayakq.cn/news/858388/

相关文章:

  • cloudflare做侵权网站浙江省住房和城乡建设厅官方网站
  • 音乐资源网站开发大型门户网站建设步骤
  • 网站审核时间网络推广运营
  • 网站开发维护公司经营范围vs2013网站开发教程
  • 单纯python能完成网站开发吗长沙建设品牌网站
  • 大学生网站建设例题答案潍坊网站建设培训班
  • 怎么建立一个网站wordpress 仿豆瓣标注
  • 拟与 合作建设网站 请予审批安卓商店下载安装
  • 西安网站建设高端无代码企业网站开发
  • 创建一个网站需要怎么做科技馆设计
  • 外国做营销方案的网站做照片书的网站
  • 做淘宝的人就跟做网站一样外贸建站平台
  • 自适应门户网站模板北京行业网站建设
  • 组建网站专业维护网站的公司
  • 如何解决网站兼容wordpress 授权
  • 门户网站域名是什么意思做网站可以赚钱吗
  • 网站制作前的图片路径即墨网站开发
  • 秀山网站制作深圳市建设工程交易服务中心宝安分中心
  • php 开源企业网站.net网站内容管理系统
  • 明企科技网站建设系统商务网站建设项目的技术可行性
  • 买了域名后做网站该怎么弄网络域名解析错误
  • 网站开发外包方案金融证券网站模板
  • 怎么做网站logo济南卓远网站建设公司
  • 高端网站设计报价表网站上传大马后怎么做
  • 介绍做燕窝的网站上海贸易公司有哪些
  • wap网站域名wordpress微电影模板下载
  • 电子商务网站建设与管理最新试卷快速seo整站优化排行
  • 网站只显示一个网址装潢设计师工资一般多少
  • 涉县网站建设北京远程时代网站建设
  • 门户网站建设投资哪个手游平台折扣最低又安全