当前位置: 首页 > news >正文

重庆市建设工程质量网站浦东新区网站推广公司

重庆市建设工程质量网站,浦东新区网站推广公司,仪征市建设局网站,wordpress主导航菜单一、前言 1、requests简介 requests是一个很实用的Python HTTP客户端库,爬虫和测试服务器响应数据时经常会用到,它是python语言的第三方的库,专门用于发送HTTP请求,使用起来比urllib更简洁也更强大。 2、requests的安装 pip i…

一、前言

1、requests简介

requests是一个很实用的Python HTTP客户端库,爬虫和测试服务器响应数据时经常会用到,它是python语言的第三方的库,专门用于发送HTTP请求,使用起来比urllib更简洁也更强大。

2、requests的安装

pip install requests

 3、利用cookie登录古诗文网

难点:我们在进行登录时观察到与许多参数,我们要对参数进行分析,在分析的时候我们发现了三个变化参数分别是VIEWSTATE, VIEWSTATEFENE, CODE 。而且我们在对登录页面解析时,并不能找到VIEWSTATE, VIEWSTATEFENE,而这样的参数一般就会放在被隐藏在页面源码之中,我们需要去对页面源码解析并获取数据,这也是现在网站喜欢用的一个反扒手段。而且古诗文网的登录页面采用动态验证码来登录,我们考虑的时获取每次登录时产生的随机验证码图片,手动输入验证码来进行登录。

import requests
url = 'https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx'
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36'
# }
response = requests.get(url=url,headers=headers)
content = response.text
#解析源码获取__VIEWSTATE __VIEWSTATEGENERATOR
from bs4 import BeautifulSoup
soup=BeautifulSoup(content,'lxml')
# #获取数据
viewstate=soup.select('#__VIEWSTATE')[0].attrs.get('value')
viewstategenerator=soup.select('#__VIEWSTATEGENERATOR')[0].attrs.get('value')# #获取验证码图片
code = soup.select('#imgCode')[0].attrs.get('src')
code_url='https://so.gushiwen.cn'+code
import urllib.request
urllib.request.urlretrieve(url=code_url,filename='code.jpg')
requests方法 session 通过session返回值使请求变为对象
session = requests.session()
response_code=session.get(code_url)
# #注意此时使用二进制数据,因为我们使用图片的下载
content_code=response_code.content
# #wb模式将二进制数据写入文件
with open('code.jpg','wb')as fp:fp.write(content_code)# #获取验证码图片以后,下载到本地,然后观察验证码,观察之后,控制台输入验证码,将值给参数code 就可以登录
code_name=input('请输入验证码')
# #点击登录
url_post ='https://so.gushiwen.cn/user/login.aspx?from=http%3a%2f%2fso.gushiwen.cn%2fuser%2fcollect.aspx'
data_post={'__VIEWSTATE': viewstate,'__VIEWSTATEGENERATOR': viewstategenerator,'from': 'http://so.gushiwen.cn/user/collect.aspx','email': '账号','pwd': '密码','code': code_name,'denglu': '登录',}
response_post=session.post(url=url,headers=headers,data=data_post)
content_post=response_post.text
with open('gushiwen.html','w',encoding='utf-8')as fp:fp.write(content_post)
以上代码大家只需要将自己的账号与密码输入进去就可以尝试登录了,如果需要其他的网站大家也可以尝试。
http://www.yayakq.cn/news/747356/

相关文章:

  • 免费seo网站推荐一下即墨市城乡建设局网站
  • 高端网站有哪些网站动态图片制作
  • 直播间 网站建设石家庄网站建设公司哪家好
  • 简单个人网站制作教程鄂州网站设计公司
  • 京建站公司网站经常被黑
  • 网页设计制作网站教程怎么进入追信魔盒网站开发软件
  • 网站打不开的解决方法攻击静态网站
  • 优秀的响应式网站模板下载模板网站的弊端
  • 南昌网站搭建制作公司新零售六大模式
  • 平面设计官方网站怎样建外贸公司网站
  • 关于百度网站的优缺点南京公司网站建设
  • 网站建设的知识东营建设信息网网站
  • 重庆建设网站多久时间好品质高端网站设计厂家
  • 广州市做网站的民权平台网站建设
  • 给企业做网站推广好么山东济宁省建设厅官方网站
  • 51的网站是啥wordpress弹窗网页
  • wordpress 新闻类网站个人网页背景图
  • 网站建设步骤实践报告品牌建设 凝心
  • 网站图片上传功能怎么做的网加速器
  • 学院网站群建设的目标创意设计工作室
  • 上海站群优化公司网站竞价词怎么做
  • 随州网站建设厂家分类信息网站营销
  • 比较好的网站建设技术开发玛沁县wap网站建设公司
  • 方案巴巴策划网站潍坊网站的公司电话
  • php做网站安全微网站建设的第一步是什么
  • 建设网站公司网站做网站维护要多少钱一年
  • 推广项目网站最后两年会出妖
  • 即墨做网站做网站怎么租用服务器
  • 信贷员在哪个网站做推广域名购买服务商
  • 做网站通常到哪找图片地方战友网站建设