当前位置: 首页 > news >正文

互联网营销 网站 推荐长春做高端网站公司

互联网营销 网站 推荐,长春做高端网站公司,网站本科,济南网站建设方案一、 Selenium Selenium是最广泛使用的开源Web UI(用户界面)自动化测试套件之一,支持并行测试执行。Selenium通过使用特定于每种语言的驱动程序支持各种编程语言。Selenium支持的语言包括C#,Java,Perl,PHP,Python和Ru…

一、 Selenium

Selenium是最广泛使用的开源Web UI(用户界面)自动化测试套件之一,支持并行测试执行。Selenium通过使用特定于每种语言的驱动程序支持各种编程语言。Selenium支持的语言包括C#,Java,Perl,PHP,Python和Ruby。Selenium支持的浏览器包括Internet Explorer,Mozilla Firefox,Google Chrome和Safari。

二、 Selenium WebDriver

WebDriver是由Selenium主持的W3C的一个标准。利用浏览器原生的API来与浏览器进行交互。使用了Client-Server的模式,还实现了一个基于HTTP的服务,对selenium提供了一套API。不同了浏览器的厂商提供自己对应的webdriver,Chrome的Chromedriver,Firefox就有专门的FirefoxDriver等,但是对外提供的API是一致的。Webdriver可以通过浏览器原生的API,对浏览器进行各种操作,由于是厂商自己提供的,稳定性、可靠性和安全性都是有保障的。

三、浏览器

常见的浏览器IE、Microsoft Edge、Chrome/Chromium、Firefox、Safari等,selenium都支持。Chrome和Chromium对比:

ChromiumChrome
开源项目不是开源项目
开发版,更新速度快,会添加新功能,性能稍低是正式版,更新速度慢,比较稳定,性能高
没有自动更新联网可以检测更新

四、Selenium工作原理


各个浏览器厂商根据WebDriver协议实现各自浏览器的webdriver,webdriver是可以向selenium客户端提供统一http接口的,常见的开发语言都可以实现selenium客户端Python、Java、C#等。
Webdriver协议接口 https://www.w3.org/TR/webdriver1/#list-of-endpoints
以Python selenium为例,实现了相关的接口协议

可以看出selenium支持多种浏览器。

调用Chrome浏览器时,selenium初始化过程中先,将chromedriver作为参数初始化Server类,并且执行start方法。


进到start方法中可以看到,执行了一个CMD的命令,就是在启动chromedriver.exe服务。

在初始化Server过程中起到了给chromedriver指定了一个空闲的端口号。


可以看到后台进程chromedriver进程并且监听51650端口

Selenium 发送http请求给webdriver,启动浏览器(有些网站反爬策略,会监控是否是webdriver驱动的浏览器

当打开一个网页是调用get方法,其实是给webdriver发送对应的http请求

五、反爬检测

1、 检测浏览器指纹

检测网站 https://bot.sannysoft.com/,左边是selenium启动的chromium,右边是手动启动。

2、 浏览器启动参数

查看命令 wmic process where caption=“chrome.exe” get caption,commandline /value
Selenium通过webdriver启动浏览器参数

手动启动浏览器参数

3、检测浏览器驱动

如果使用webdriver启动的浏览器,会被检测window.navigator.webdriver

4、 检测webdriver特征

Webdriver源码:

检测结果淘宝滑动验证失败:

通过js可以看出对webdriver的特征检测等

六、优化方案

1、 给webdriver添加日志选项,方便出问题时定位分析。

2、 使用undetected_chromedriver隐藏特殊标识
1)、打开浏览器的时,注入js修改webdriver属性值。


3、 修改webdriver二进制文件中的特征值

4、 先启动浏览器,然后再使用webdriver连接控制。

七、扩展(Chrome DevTools Protocol)

谷歌浏览器开发协议,Chrome DevTools 就是一个 Web 服务工具,它通过使用 Chrome DevTools Protocol 与后端进行交互。浏览器启动时加上参数 --remote-debugging-port={port}就可以通过发送http和websocket请求直接控制浏览器。
启动浏览器chrome.exe --remote-debugging-port=9255
发送请求查看浏览器信息,包含websocket连接url。


新建浏览器标签页,其中页包含了新标签页的websocket连接url。

Cdp开源信息 https://github.com/ChromeDevTools/awesome-chrome-devtools 支持的语言和第三方库。

Python的第三方库

  1. Pychrome调用简单,但是版本较老,很久没有维护,(网捕手也集成这个库)
  2. Pyppeteer是用python改写官方提供的js代码,支持异步,使用广泛容易被反爬策略识别。
http://www.yayakq.cn/news/165474/

相关文章:

  • 成都设计网站建设如何建网站教程视频
  • 建设公司网站有什么好处公司网站建设与维护方案ppt
  • 汕头龙湖网站建设广西网站建设哪里好
  • 网站诊断与优化的作用工程建筑公司
  • 网页做二维码哪个网站好住房与城乡建设部
  • 扬州做网站需要多少钱wordpress add_options_page
  • html5网站模板移动端wordpress 产品多个分类
  • 网站建设全包方案wordpress授权系统
  • 创建电子商务网站的步骤初中生电脑作业做网站
  • 名师工作室网站建设 意义个人网站如何获得流量
  • 创业网站建设政策免费成品网站那里好
  • 购物网站排行网站建设流程有哪七步
  • 网站开发需要多少行代码wordpress 首页 未登录
  • 网站建设要学多少课程做网站怎么在国外服务器租用
  • 台州专业做网站一天能赚100元的app
  • 品牌建设网站服务包装设计公司名字
  • 湖北手机网站制作原始传奇经典复古
  • 网站建设需求调研通知wordpress 5.1不提示自动更新
  • 电脑用虚拟机做网站国外网站建设现状图分析
  • 动漫设计培训机构哪里好什么是seo教程
  • 仙居建设局网站做网站必需要在工商局备案吗
  • 网站整体色调wordpress怎么绑定paypal
  • 做动态影集的网站网站建设人才招聘
  • 哪里有手机网站建设联系方式asp网站后台管理系统密码破解
  • 湛江网站如何制作wordpress 调用多媒体
  • 做网站都需要数据库吗怎么把现有网站开发php
  • 设计学校网站模板互联网营销策划案
  • 昆明百度智能建站t购物网站开发前景
  • 站长工具seo排名查询做网站后台需要什么知识
  • 凡诺企业网站管理系统电子商务网站建设与管理的感受