当前位置: 首页 > news >正文

网站开发 招聘怎么注销建设银行网站用户

网站开发 招聘,怎么注销建设银行网站用户,方向专业网站制作咨询,工业设计考研可以考什么专业import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下&#xff…
import requestsurl = 'https://movie.douban.com/top250'
response = requests.get(url)
# 查看结果
print(response)

在这里插入图片描述

  在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下,不是说不可用就放弃了。爬虫时经常会遇到有些网站有反爬机制,为了能够请求成功该如何操作?那当然是把我们伪装成浏览器了!

  那么如何把自己伪装成浏览器代替我们发送请求呢?pycharm有个字典Headers,我们需要在浏览器中找到键User-Agent对应的值

User-Agent:对应的值包含了浏览器、操作系统的各项信息。如果没有User-Agent,就相当于赤裸裸的去访问对方服务器,只要对方有反爬虫机制,就能发现你是爬虫。

在浏览器中打开想要爬取的网站,右键 --> 检查然后如下图操作:

在这里插入图片描述

  也有的网站刷新后出现的项目很少,甚至点开没有User-Agent对应的值,但是有一个项目里面一定有 : 项目名跟网站地址很相近的项目中。例如在本例中名为www.zhihu.com的项目里一定含有。

  在以贝壳租房为例,打开网页后,右键 --> 检查,在项目名为zufang中一定含有User-Agent对应的值

在这里插入图片描述

获取键user-agent对应的值后,我们把键与值写入字典Headers中

import requests# 1. 浏览器伪装
url = 'https://movie.douban.com/top250'
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
}
# 获取响应结果
response = requests.get(url, headers=headers)
# 查看状态码
print(response.status_code)  # 200
# 获取网页源代码
# print(response.text)
http://www.yayakq.cn/news/760769/

相关文章:

  • 如皋做网站的公司网站做cdn需要注意什么意思
  • 网站后台不显示网站怎么做不违法吗
  • 个人做 下载类网站三合一网站建设公司
  • 盐城网站设计公司做婚纱影楼网站的价格
  • 域名备案网站服务内容美容美发网站模板
  • php如何搭建网站后台楚天网站建设合同
  • html制作网站重庆做网站开发的集中
  • 化妆品网站建设思路做网站需要走哪些程序
  • 集团公司网站模板海报设计在线生成免费
  • 餐饮网站建设网站建设费用会计入什么费用
  • 即墨区城乡建设局网站官网网页制作的企业
  • 阿里云空间部署网站广西建设职业技术学院
  • 代理网站地址推介做界面的网站
  • 织梦高端html5网站建设工作室网络公司网站模板公司网站建设技术
  • 网站建设及优化 赣icp网站制作的要求
  • 如何创建游戏网站软件开发公司推荐
  • 博海博海网站建设新手怎么引流推广推广引流
  • 大型网站架构实战展览会建设网站平台的作用
  • 网站建设公司的成本有哪些方面网站备案没了
  • 不建网站如何做淘宝客做母婴育儿类网站好做seo排名吗
  • 云南省网站建设公司郴州最大的网络科技公司
  • 江苏手机网站建设公司wordpress页脚太高
  • 网站必做外链网站集约建设报告
  • 萍乡网站推广小程序介绍怎么写吸引人
  • 网站建设所学内容关闭wordpress注册功能
  • 网站开发 360浏览器做的网站很卡是什么原因呢
  • 网站代理怎么做的百度站长如何添加网站
  • 网站手机网页如何做网站推广运营招聘
  • asp网站如何做伪静态网站改版对网站优化影响最大的问题有哪些
  • 网站开发目标开题报告微站开发