当前位置: 首页 > news >正文

google网站管理员中心国外平面设计

google网站管理员中心,国外平面设计,江苏汇算清缴在哪个网站做,广州网站建站公司目录 一、反爬内容1、案例12、案例2 二、后来发现的问题解决 一、反爬内容 1、案例1 反爬的响应文本返回如下:爬虫均能精准识别,测试链接:https://ziyuan.baidu.com/crawltools/index)非正常爬虫访问时:返回的压缩报文内容无法直接识别,可一定程度上保护站点信息安…

目录

      • 一、反爬内容
        • 1、案例1
        • 2、案例2
      • 二、后来发现的问题解决

一、反爬内容

1、案例1
  • 反爬的响应文本返回如下:
  • 爬虫均能精准识别,测试链接:https://ziyuan.baidu.com/crawltools/index)
  • 非正常爬虫访问时:返回的压缩报文内容无法直接识别,可一定程度上保护站点信息安全;(伪装成爬虫的恶意请求、非爬虫服务器的SEO检测工具等)
  • 注:用户浏览器和爬虫看到的页面完全一致,如果您有顾虑,也可以进入网站后台=>网站管理=>站点信息=>关闭网站加速功能
    在这里插入图片描述
  • 用requests请求也是上面的响应内容返回
    from curl_cffi import requests as curl_requestsres = curl_requests.get("http://hanxbio.com/cpgx",  timeout=30, impersonate="chrome124")
    print(res.text)
    
  • 但是linux机器上自动化也是,难道自动化被反爬了?(windows上面是正常的)
    from DrissionPage import ChromiumPage, ChromiumOptions, WebPage
    co = ChromiumOptions().set_paths(browser_path="/data/code/spiderprj/src/crawlsall/DrugMonitor/cancel_fixed")
    co.headless(True)  # 设置无头加载  无头模式是一种在浏览器没有界面的情况下运行的模式,它可以提高浏览器的性能和加载速
    # co.incognito(True)  # 无痕隐身模式打开的话,不会记住你的网站账号密码的
    co.set_argument('--no-sandbox')  # 禁用沙箱 禁用沙箱可以避免浏览器在加载页面时进行安全检查,从而提高加载速度 默认情况下,所有Chrome 用户都启用了隐私沙盒选项  https://zhuanlan.zhihu.com/p/475639754
    co.set_argument("--disable-gpu")  # 禁用GPU加速可以避免浏览器在加载页面时使用过多的计算资源,从而提高加载速度
    co.set_user_agent(user_agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36')  # 设置ua
    # co.set_proxy('http://127.0.0.1:10109')
    co.set_local_port(9211)
    page = ChromiumPage(co)
    page.get("http://hanxbio.com/cpgx")
    print(page.html)
    print(page.ele('x://div[@id="txt_con_243_39"]//table').html)
    
2、案例2
  • This page isn’t working , 同样是代理问题
    在这里插入图片描述
    在这里插入图片描述

二、后来发现的问题解决

  • 自动化问题解决方案:linux机器我设置的那个代理有问题,挂了co.set_proxy('http://127.0.0.1:10109')代理则会返回如下内容,去掉那个代理ip则正常返回
    在这里插入图片描述
  • requests解决方案,找到有数据的具体的接口api请求
    from curl_cffi import requests as curl_requestsres = curl_requests.get("https://nwzimg.wezhan.net/pubsf/18028/18028944/cdn-static-pages/pages/pc/170828_zh-cn.html.Body.js?version=20240723111847",  timeout=30, impersonate="chrome124")
    print(res.text)
    
http://www.yayakq.cn/news/327266/

相关文章:

  • php 网站做分享功能做网站美工工资多少钱
  • 局域网网站开发软件网站开发可以多少钱一个月
  • 企业网站建立哪与传统市场营销的区别与联系有哪些
  • 上海网架公司seo排名工具给您好的建议下载官网
  • 如何做网站本地服务器吗免费装修效果图大全
  • 中山网站设计与建设百度免费推广网站
  • 做电玩城设计的网站关于京东商城网站建设的实践报告
  • php和mysql做租车网站平台设计标准
  • 商城网站建设排名阿里巴巴网站备案号
  • 东莞企业做网站什么网站免费购物商城
  • 网站建设公司推荐兼职网站的建设目标怎么写
  • 建一个网站需要做什么的常平众展做网站
  • 旅游景区网站建设策划书做一个公众号多少钱
  • 十堰网站seo技巧云服务器网站解析
  • 网站开发合同答案做外单网站有哪些
  • 建站平台选择建议蓝气球卡地亚手表官方网站
  • 东莞定制网站开发网页微信小程序
  • 网站如何做跳板合肥网站建设王道下拉??
  • 东莞网站优化排名公司广告推广赚钱
  • vs做网站加背景杭州电子商务网站开发
  • 网站开发范围说明书怎么用自己的主机做网站服务器
  • 郑州一站式网站搭建WordPress的插件怎么保存
  • 网站开发发展和前景自己做网站有何意义
  • 全国做网站公司排名深圳关键词推广排名
  • wordpress邮箱汉化插件下载合肥专业网站优化
  • 桂林建站平台哪家好开平设计网站
  • 免费的行情软件网站下载免费网站的流量是什么意思
  • 长丰网站制作网站模版制作
  • 个人做的网站不能做淘客房屋装修图片
  • seo关于网站搜索排名关键词的标准评定广东新闻联播2011