当前位置: 首页 > news >正文

建网站的公司哪里好用idea做html网站

建网站的公司哪里好,用idea做html网站,怎么才能提高网站点击量 免费,山西大同专业网站建设价格一般步骤:确定网站--搭建关系--发送请求--接受响应--筛选数据--保存本地 1.拿到网站首先要查看我们要爬取的目录是否被允许 一般网站都会议/robots.txt目录,告诉你哪些地址可爬,哪些不可爬,以安全客为例子 2. 首先测试在不登录的…

一般步骤:确定网站--搭建关系--发送请求--接受响应--筛选数据--保存本地

1.拿到网站首先要查看我们要爬取的目录是否被允许

一般网站都会议/robots.txt目录,告诉你哪些地址可爬,哪些不可爬,以安全客为例子

2. 首先测试在不登录的情况下是否请求成功

 可见,该请求成功;有很多网站在没有登录的情况下是请求失败的,这时需要添加请求头信息,

注意:有的cookie 会根据时间戳生成,有的会失效

haders={},

2.1、首先 F12 到 Network 下,F5刷新 ,复制 Requests Headers然后把它转换成 json 格式

 2.1.1 Requests Headers 转 json 格式有很多种方法

1. 在线转 json 格式的网站:在线HTTP请求/响应头转JSON工具 - UU在线工具

2.如果电脑没网 在终端下载:pip install feapder

                                           feapder create -j 

req=requests.get(url=url).text  是把所有的文本都提取出来,会很乱,所有我们需要筛选,整理一下

可以发现,我们需要的数据在 a 标签中

<a target="_blank" href="/post/id/291754">苹果委托进行数据泄露研究,以强调端到端加密的必要性</a>

数据多了id位数也可能会增加;也可以把id写死,根据291754是个六位数,所以 \d{6}只匹配 id是六位数的。

Title=re.findall(r'<a target="_blank" href="/post/id/\d+">(.*?)</a>',req)

 \d+

注意代码格式 

range() 取值 [ )

 最终代码:

import re
import requests
#headers={}
url='https://www.anquanke.com/'
req=requests.get(url=url).text
# print(req)
dict={}
for i in range(1,20):dict['Title']=re.findall(r'<a target="_blank" href="/post/id/\d+">(.*?)</a>',req)[i]dict['url']=re.findall(r'<a target="_blank" href="(/post/id/\d+)">',req)[i]print(dict)

 优化后的代码:

import re
import requests
url='https://www.anquanke.com/'
req=requests.get(url=url)
print(req.status_code)
req=req.text
dict={}
Title=re.findall(r'<a target="_blank" href="(/post/id/\d+)">(.*?)</a>',req)
# print(Title)
for title in Title:dict['Title']=title[1]dict['url']=url+title[0]print(dict)

http://www.yayakq.cn/news/309949/

相关文章:

  • 佛山公司建站岳阳工程造价信息网
  • flash网站建设公司重庆广告网站推广
  • 外包网站开发合同范本最新网站推广哪家好
  • 东莞制作网站wordpress ftp密码
  • 东莞市建设局门户网站软件开发工程师简历模板
  • 怎么搭建一个完整的网站茗哥网站建设
  • 怎么做网站小图标建设工程包括哪些
  • 网站的佣金怎么做会计分录wordpress主题企业
  • 宁夏交通建设质监局官方网站创建网站的app
  • 做 cad效果图网站手机qq插件wordpress
  • 山西省国贸网站建设重庆拓达建设集团网站
  • 企业招聘网站大全免费云南网站建设维护
  • 网站建设公司怎么宣传wordpress php拓展
  • 手机网站描述seo网络推广培训班
  • 深圳建材公司app谷歌外贸seo
  • 郑州区块链数字钱包网站开发过程邢台seo公司
  • 生鲜电商网站建设与管理大连装修公司排名榜
  • 试卷网站在线做用html做网站源代码
  • 网站备案需要审核多久新公司简介范文
  • 做电影网站用什么服务器做网站点击率赚钱
  • 怎么下学做衣服网站如何建立微信公众号怎么申请
  • 越南国家建设部网站国外用tornado做的网站
  • 创意型网站建设厦门做外贸网站
  • 网站开发综合实训心得看网站用什么软件
  • 网站开发协议书 英文版创新的做网站
  • 互联网平台推广资源seo网站优化排名
  • 烟店网站建设wordpress投稿者权限
  • 个体工商户可以做网站备案吗软文写作营销
  • 山西+网站建设建设工程合同无效工程价款的结算
  • 东莞外贸网站建设哪家好镇网站建设管理工作总结