当前位置: 首页 > news >正文

广州网站建设招标wordpress the_date()

广州网站建设招标,wordpress the_date(),中国工商注册网官网网址,免费印章logo在线制作day4 selenium爬取数据 一、selenium基本操作 导入相关模块: from selenium.webdriver import Chrome(一)、创建浏览器对象 b Chrome()(二)、打开网页(需要爬取哪个页面的数据就打开该页面对应的网页地址) 案例:爬取豆瓣电影…

day4 selenium爬取数据

一、selenium基本操作
导入相关模块:
from selenium.webdriver import Chrome
(一)、创建浏览器对象
b = Chrome()
(二)、打开网页(需要爬取哪个页面的数据就打开该页面对应的网页地址)
案例:爬取豆瓣电影250排行榜
b.get('https://movie.douban.com/top250?start=0&filter=')
(三)、获取网页源代码(注意:不管以什么方式更新了界面内容,page_source也会自动更新)
print(b.page_sourse)   # 获取豆瓣top250的页面源代码
二、selenium的翻页
导入相关模块
import time   # 控制停顿时间的模块from selenium.webdriver import Chrome
(一)、翻页方法1
  1. 找到不同页面地址的变化规律,利用循环实现多页数据的请求
b = Chrome()  # 这个是打开浏览器,一定要放在循环的外面for x in range(0, 256, 25):  # 找出的页数变化b.get('https://movie.douban.com/top250?start={x}&filter=')print(b.page_source)
(二)、翻页方法2
  1. 点击翻页按钮,刷新页面内容,在刷新后再次获取网页源代码
导入模块:
from selenium.webdriver.common.by import By
b = Chrome()
b.get('https://movie.douban.com/top250?start=0&filter=')for _ in range(5):print(b.page_source)# 获取下一页按钮# next = b.find_element(By.CLASS_NAME, 'next')# 点击下一页按钮# next.click()b.find_element(By.CSS_SELECTOR, '.next')
  1. 翻页方法2涉及的知识点
  • selenium获取标签
浏览器对象.b.find_element(获取方式,数据)    —— 返回符合条件的第一个标签,结果是标签对象
浏览器对象.b.find_elements(获取方式,数据)    —— 返回符合条件的所有标签,结果是列表,列表中的元素是标签对象获取方式:
By.ID   ——  通过ID属性值获取标签
By.CLASS_NAME   ——  通过class属性值获取标签
By.CSS_SELECTOR   —— 通过css选择器获取标签
By.LINK_TEXT     —— 通过a标签的标签内容获取标签
By.PARTIAL_LINK_TEXT   —— 通过标签内容所包含的部分内容来获取完整标签
  • 操作标签
1)输入框输入内容:输入框对应的标签.send_kyes(需要输入的内容)  ——  括号里输入需要输入的内容
2)点击标签:标签对象.click()
三、用代码控制浏览器滚动
js中页面滚动的代码:window.scrollBy(x方向的偏移量,y方向的偏移量)

滚动1次

b.execute_script('window.scrollBy(0,500)')   # 顺着Y轴滚动500

滚动多次

for x in range(10):   # 滚动10次b.execute_script('window.scrollBy(0,500)')time.sleep(1)   # 每滚动一次就停顿1秒
input(‘结束’)    # 如果不想关闭浏览器就加个input,入股要关闭则不加
http://www.yayakq.cn/news/192960/

相关文章:

  • 中和华丰建设有限责任公司网站桂林阳朔楼盘最新价格
  • 网站建设在线建站做行业网站如何采集信息
  • 苏州网站优化徐州网站建设技术托管
  • 如何选择专业网站开发商电商网站建设网络公司
  • 花都 网站建设科技部火炬中心
  • 个人备案的网站内容做网站要学哪些代码
  • 网站备案信息保护湖南网站开发 岚鸿
  • 吴江城乡住房和城乡建设局网站晋城网站seo
  • 歌手网站建设介绍自己做的电影网站
  • 网站建设就业培训廊坊公司网站建设
  • 郑州做营销型网站的公司wordpress笑话
  • 做网络的网站很重要吗wordpress后台发布文章发不
  • 高端室内设计工作室大连谷歌seo
  • 简历设计网站布吉做棋牌网站建设
  • html5做音乐网站网站建设下单源码
  • 刷赞网站推广ks网站竞价推广托管公司
  • 未备案网站处理系统百元便宜建站
  • 微信官网下载安装微信石家庄网站排名优化
  • 如何申请com网站wordpress配置cdn
  • php做的网站怎么运行wordpress怎么引用新浪ajax
  • 网站建设推广注意什么网站备案了有什么好处
  • 东莞销售网站建设请别人做网站如何交付
  • 广西圣泰建设工程有限公司网站网站用的什么字体设计
  • 我做的网站怎样推广的自适应网站优点缺点
  • 湖南网站开发公司电话集约化网站建设的函
  • 建设银行u盾自动弹出网站wordpress多站点统计
  • 网站建设 qq业务网制作免费虚拟机下载手机版
  • 网站关键词搜不到了沈阳网站建设哪家便宜
  • 用illustrator做网站昆明网站定制
  • 网站返回按钮设计找人做的网站第二年多钱