当前位置: 首页 > news >正文

随州北京网站建设地址信息采集平台

随州北京网站建设,地址信息采集平台,娄底网站优化,甘南网站设计公司这个需要调用requests模块(相当于c的头文件) import requests 还需要一个User-Agent头(这个意思就是告诉python用的什么系统和浏览器) Google Chrome(Windows): Mozilla/5.0 (Windows NT 10.0; Win64; x64…

这个需要调用requests模块(相当于c++的头文件)

import requests 

 还需要一个User-Agent头(这个意思就是告诉python用的什么系统和浏览器)

Google Chrome(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36

Mozilla Firefox(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.

Microsoft Edge(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.774.63 Safari/537.36 Edg/89.0.774.63

这仨是常用的,谷歌 火狐  Edge, 我这里使用的是edge 

headers_list =  {'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.774.63 Safari/537.36 Edg/89.0.774.63'}

 找到网页后就可以扒内容了

with open('response.txt', 'w', encoding='utf-8') as file:  

    for headers in headers:  

        # 发送请求  

        response = requests.get(url, headers=headers)  

        # 打印状态码  

        print(f'Sent request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

        # 如果请求成功,保存返回内容  

        if response.status_code == 200:  

            file.write(f'Response with header: {headers["User-Agent"]}\n')  

            file.write(response.text )  

        else:  

            file.write(f'Failed request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

print('请求成功!')

完整代码如下

import requests  # 定义要访问的URL  
url = 'http://baidu.com'  # 请替换为你要访问的网站  # 定义User-Agent头  
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0',
}
# 创建一个TXT文件来保存返回的内容  
with open('response.txt', 'w', encoding='utf-8') as file:  for headers in headers:  # 发送请求  response = requests.get(url, headers=headers)  # 打印状态码  print(f'Sent request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  # 如果请求成功,保存返回内容  if response.status_code == 200:  file.write(f'Response with header: {headers["User-Agent"]}\n')  file.write(response.text)  else:  file.write(f'Failed request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  print('请求成功!')  

 结果如下

 

 文本如下

http://www.yayakq.cn/news/284837/

相关文章:

  • 小企业如何建网站重庆网站建设 吧
  • 正规网站模板设计图莱芜网站建设莱芜
  • 小型劳务公司注册条件商城类网站如何做seo
  • 科技创新网站建设策划书最新个人注册公司流程
  • 建设旅游门户网站做网站去哪找源码
  • 白云企业网站建设曲阜网站设计
  • 家庭清洁东莞网站建设技术支持用手机搭建自己的网站
  • 佛山网站建设公司有哪些?山西大同专业网站建设制作价格
  • 三合一网站模板东莞响应式网站
  • 中国海员建设工会网站网站建设消费调查问卷
  • 大连html5网站建设报价电商网站建设与维护试题
  • 做公司网站 需要注意什么手机网站模板用什么做
  • 简述网站建设基本流程图胶东国际机场建设有限公司网站
  • 网站建设的公司好做吗营销型网站建设的特别之处都有哪些
  • 在意派建设好网站后推荐专业做网站公司
  • 建设网站江西织梦网站根目录标签
  • 教育加盟培训网站建设一个做网站的团队需要哪些人员
  • c 教程如何做网站青岛网站建设莫道网络
  • 佛山网站建设公司怎么选垂直版面网站
  • 怎么给自己的网站做扫描码网站设计什么样风格会高端些
  • 网站开发到上线的过程公司做网站能够带来的好处
  • 网站建设优化陕西羽毛球赛事视频
  • 济南协会网站设计团队网站体验分析
  • 建设糖果网站的好处有哪些网站推广专业术语
  • 网络营销知识网站学做窗帘的网站
  • 郑州网站开发hndlwx哪个网站可以做全景图
  • ai网站大全鸿蒙系统软件开发教程
  • 农林牧渔行业网站建设全球招商网加盟网
  • 池州网站网站建设360建筑网一级消防
  • 做网站的电销话术吉安哪家做网站的公司好