当前位置: 首页 > news >正文

网站制作标准企业内部网页设计

网站制作标准,企业内部网页设计,在凡客建站中建设网站方法,专门做讲座的英语网站⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ 🐴作者:秋无之地 🐴简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据…

⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️
🐴作者:秋无之地

🐴简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据开发、数据分析等。

🐴欢迎小伙伴们点赞👍🏻、收藏⭐️、留言💬

这次来给大家分享一下小红书笔记的爬取方式,希望对大家有帮助!

一、找到目标数据:

小红书笔记的内容和互动数据(点赞数、收藏数、评论数)如下:

二、找到数据所在接口或页面:

通过f12,搜索笔记ID,找到对应的接口,然后在接口返回信息体中,搜索点赞数,发现找到对应的数据,说明这个接口或页面就是我们的目标

三、检查接口或页面的请求参数:

通过检查接口的请求参数,判断是否有加密参数、混淆参数等,下图可以看到,除了一个cookie参数以外,其他参数都是不变的

四、获取登录cookie:

一般获取登录cookie,方式有2种,第一种是接口请求,另一种是模拟登录,相对而言,第二种简单点。具体操作,请查下我另一个的一篇文章。

五、返回数据抽取目标数据:

目标数据是存放在这个字典中,可以使用正则匹配,匹配结果就能通过字典读取了。

# 正则匹配
note_result = re.findall(r'__INITIAL_STATE__=(.*?)</script>', note_res)[0].replace("undefined",'null')
###用户描述###
# 笔记标题
note_info_dict['title'] = note_dict['title']
# 笔记数据
interactions = note_dict['interactInfo']
# 点赞数
note_info_dict['liked_count'] = int(interactions['likedCount'])
# 收藏数
note_info_dict['collected_count'] = int(interactions['collectedCount'])
# 评论数
note_info_dict['comments_count'] = int(interactions['commentCount'])
# 分享数
note_info_dict['share_num'] = int(interactions['shareCount'])

以上就是我的分享,如果有什么不足之处请指出,多交流,谢谢!

如果喜欢,请关注我的博客:https://my.csdn.net/weixin_42108731

http://www.yayakq.cn/news/560080/

相关文章:

  • 查询网站怎么做的手机免费发布信息平台
  • 购物网站开发教程 视频做网站 卖产品
  • 论坛网站如何备案中企动力官网 网站
  • 天津在线制作网站wordpress 恢复初始
  • 网站开发公司有什么福利网站怎么弄二维码
  • 帝国做网站是选择静态还是伪静态Php做网站创业
  • pc网站怎么做广州好玩的地方和景点
  • 手机网站开发指南小程序开发报价表
  • 网站样式模板下载珠海响应式网站建设公司
  • 网站备案 电信广州有几个区图片
  • 制作网站的模板下载深圳市宝安区中医院
  • 做数据可视化的网站公司制作一个网站
  • 学校网站推广方案58同城建设网站
  • 网上做问卷报酬不错的网站是网站打开慢什么原因
  • 番禺做网站服务目前网站类型主要包括哪几种
  • 公司网站建设哪家正规wordpress安装插件要求ftp
  • 做网站现在什么最赚钱吗淄博网站公司
  • seo 优化一个月费用网站优化哪里可以做
  • 自做网站好做吗win7 iis设置网站首页
  • 建设网站e护航下载网站系统性能定义
  • 创建一个网站的项目体现项目完成速度因素的做网站什么服务器好
  • 网站建设论文摘要王野天明星
  • 静海做网站公司建设部网站官网施工合同文本
  • 网站整站外贸建站如何推广
  • 温州网站建设技术外包马关网站建设
  • 电子网站建设的实践目的手机网站页面制作
  • 沛县做网站xlec页面调用不了wordpress
  • 公司的网站建设公司建立自己的网站平台的好处
  • 马云的网站是谁建设的泉州网站制作建设
  • 如何查找高权重网站手机做网站用什么