当前位置: 首页 > news >正文

微信公众号网站开发模板旅游网站内容

微信公众号网站开发模板,旅游网站内容,滴滴优惠券网站怎么做的,登录注册入口目录 介绍启动方法功能一、爬虫优势如何实现爬虫小demo 功能二、执行脚本百度搜索脚本demo 功能三、获取cookie(这个只能是模拟浏览器当前进入网页的cookie不是平时用的下载的的浏览器的cookie)功能四、监控网页,进行性能分析 介绍 puppetee…

目录

  • 介绍
  • 启动方法
  • 功能一、爬虫
    • 优势
    • 如何实现
    • 爬虫小demo
  • 功能二、执行脚本
    • 百度搜索脚本demo
  • 功能三、获取cookie(这个只能是模拟浏览器当前进入网页的cookie不是平时用的下载的的浏览器的cookie)
  • 功能四、监控网页,进行性能分析

介绍

puppeteer是一个可以控制chrome的库,可以模拟一些交互行为。

启动方法

启动浏览器,然后打开一个页面,之后跳转到一个网址打开页面

// Launch the browserconst browser = await puppeteer.launch({ headless: "new" });// Create a pageconst page = await browser.newPage();// Go to your siteawait page.goto("https://www.baidu.com");

功能一、爬虫

优势

  1. 与普通爬虫相比它更简单,因为它用的是真实的chrome环境,不需要我们配置各种header的参数
  2. 它能等待js动态生成的内容之后进行爬虫
  3. 他能能够截图并保存为图片

如何实现

获取网页元素
这里用waitForSelector用选择器进行爬取,这边都是异步的函数,这也是puppeteer的优势,它可以等待一些动态变化之后再爬取

// Query for an element handle.const element = await page.waitForSelector("span.title-content-title");// Get the text content of the elementconst textContent = await page.evaluate((element) => element.textContent,element);

截图
保存图片用screenshot方法,保存pdf用pdf方法(而且pdf是带链接的)

await page.screenshot({path: "1.png",fullPage: true,});await page.pdf({path: "1.pdf",fullPage: true,});

爬虫小demo

let puppeteer = require("puppeteer");(async () => {// Launch the browserconst browser = await puppeteer.launch({ headless: "new" });// Create a pageconst page = await browser.newPage();// Go to your siteawait page.goto("https://www.baidu.com");// Query for an element handle.const element = await page.waitForSelector("span.title-content-title");// Get the text content of the elementconst textContent = await page.evaluate((element) => element.textContent,element);console.log(textContent);// Dispose of handleawait element.dispose();// Close browser.await browser.close();
})();

功能二、执行脚本

上面爬虫的那个evaluate方法就是执行脚本的方法,执行脚本之后可以返回一个值作为结果。

  const result = await page.evaluate(() => {// 在此处编写要执行的脚本return xxx;});

百度搜索脚本demo

  // 执行脚本const result = await page.evaluate(() => {// 在此处编写要执行的脚本let input = document.querySelector("input#kw");input.value = "nodejs教学";let search = document.querySelector("input#su");search.click();return "已搜索";});console.log(result); // 输出脚本执行结果// 等待两秒等待页面加载完成await page.waitForTimeout(2000);await page.screenshot({path: "nodejs.png",fullPage: true,});

结果生成的图片
在这里插入图片描述

功能三、获取cookie(这个只能是模拟浏览器当前进入网页的cookie不是平时用的下载的的浏览器的cookie)

let cookie = await page.cookies();

功能四、监控网页,进行性能分析

  // 跟踪// 启动跟踪await page.tracing.start({ path: "trace.json" });。。。。。。// 停止跟踪await page.tracing.stop();// 导出跟踪结果const tracingData = await page.tracing.export();// 保存跟踪结果为JSON文件require('fs').writeFileSync('trace.json', tracingData);

这里生成的json文件可以通过浏览器的F12里的性能里上传按钮上传,之后就能看到可视化的性能分析,结果图如下
在这里插入图片描述

http://www.yayakq.cn/news/353484/

相关文章:

  • 如何看网站是否有做网站地图响水做网站的公司
  • wps哪个工具做网站wordpress二级菜单代码
  • 上海做网站建设中国银行门户网站
  • 模板网站开发推广织梦发布网站
  • 虚拟主机控制面板怎么建设网站网站开发技术说明文档
  • 网站开发需要什么人才专业手机网站建设平台
  • 营销型企业网站类型网站管理人员队伍建设有待加强
  • 青柠海报设计网站网络规划设计师教程(第2版) 严体华 pdf
  • wordpress订阅者广州百度搜索排名优化
  • 怎么做一个电商网站吗做名片赞机器人电脑网站是多少钱
  • 珠海网站建设珠海中山市 做网站
  • 专业格泰网站建设龙岗菠菜网站建设
  • 电子商务网站建设新手铜陵电子商务网站建设
  • 厦门外贸企业网站建设哈尔滨调整部分地区风险等级
  • 网站虚拟主机有什么用做公司网站客户群体怎么找
  • 网站开发工作描述开发网站性能监控
  • 网站建设 流程 域名申请做网站服务器是必须购买的吗
  • 网站制作的公司qq云 wordpress
  • 济宁网站建设电话成都网站优化步骤
  • 威海微网站建设长沙软件公司排行榜
  • 做视频网站需要执照吗中原建设信息网 网站
  • 仿网站教程宜兴网站策划
  • 移动端网站设计前有哪些准备工作?西宁网站建设建站
  • wordpress视频站插件北京设计企业网站
  • 网站空间支持功能百度快照seo
  • 学做美食视频网站温州论坛网站首页
  • 网站改版思路wordpress 书 主题
  • 重庆游戏网站开发百度舆情
  • 外贸网站建设及优化ppt模块深圳关键词seo
  • 前端做网站都要做哪些wordpress评论加入点赞