当前位置: 首页 > news >正文

做网站运营需要具备什么能力中电建铁路建设公司网站

做网站运营需要具备什么能力,中电建铁路建设公司网站,哪有培训seo,网站开发实用技术相关论文一、评论爬取 以百度贴吧中“美团骑手吧”为例,对页面中的帖子评论进行爬取,并将结果以json的格式保存到本地中。 from lxml import etree import requests import json# 根据网页url获取评论 def GetComments(url):# 使用requests库发送GET请求&#…

一、评论爬取

以百度贴吧中“美团骑手吧”为例,对页面中的帖子评论进行爬取,并将结果以json的格式保存到本地中。

from lxml import etree
import requests
import json# 根据网页url获取评论
def GetComments(url):# 使用requests库发送GET请求,获取网页内容,并将响应内容编码设置为utf-8response = requests.get(url)response.encoding = 'utf-8'content = response.text #将响应内容转换为字符串ret = etree.HTML(content) #使用lxml库的HTML方法解析网页内容# 使用XPath表达式提取所有帖子信息lists = ret.xpath('//li[@class=" j_thread_list clearfix thread_item_box"]')#  依次获取每条帖子的评论信息,并存放在my_list列表当中for list in lists:global my_listcomment = str(list.xpath('.//div[@class="threadlist_abs threadlist_abs_onlyline "]/text()')[0].strip())my_list.append(comment)if __name__ == '__main__':base_url = 'https://tieba.baidu.com/f?kw=%E7%BE%8E%E5%9B%A2%E9%AA%91%E6%89%8B&ie=utf-8&pn='my_list = []# 每50条数据为1页,依次获取多个页面的帖子评论for i in range(0,50,50):url = base_url + f'{i}'GetComments(url)# 将获取的帖子评论以json格式进行保存with open('list_file.json', 'w', encoding='utf-8') as file:json.dump(my_list, file, ensure_ascii=False, indent=4)

二、情感分析

根据上述爬取到的评论,利用snowlp工具进行情感分析,将评论分为“积极”“中性”消极“,并根据数量占比进行可视化。

from snownlp import SnowNLP
import matplotlib.pyplot as plt
import json# 定义全局变量comments,用于存储评论数据
global comments# 获取在本地存放的评论数据
with open('list_file.json', 'r', encoding='utf-8') as file:comments = json.load(file)# 利用情感分析函数对每一条评论进行分析,判断其情感色彩
def sentiment_analysis(text):s = SnowNLP(text)if s.sentiments > 0.6:return "积极"elif s.sentiments < 0.4:return "消极"else:return "中性"# 对评论数据进行情感分析
sentiments = [sentiment_analysis(comment) for comment in comments]# 统计各类情感的数量
positive_count = sentiments.count("积极")
negative_count = sentiments.count("消极")
neutral_count = sentiments.count("中性")# 可视化处理
labels = ["积极", "消极", "中性"]
sizes = [positive_count, negative_count, neutral_count]
colors = ["green", "red", "gray"]
explode = (0.1, 0, 0)plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置字体为黑体plt.pie(sizes, explode=explode, labels=labels, colors=colors, autopct="%1.1f%%", shadow=True, startangle=90)
plt.axis("equal")
plt.show()
http://www.yayakq.cn/news/71796/

相关文章:

  • 招聘网站如何做薪酬报告文字图片生成器在线
  • 类似于拼多多的网站怎么做dedecms网站制作教程
  • 单页购物网站源码在东莞做
  • asp.net 发布网站 ftp长沙企业建站
  • 网站开发的pc或移动端网站域名备案查询官网
  • 服务器系统搭建网站源码做网站的封面图片哪里才有
  • 网站开发岗位职责中小企业网站制作广州网络服务公司找赛合公司
  • 招聘网站建设初衷wordpress批量上传文章
  • 用jsp做校园网站福田欧曼价格
  • 为什么要找对做网站的公司应用搭建平台
  • 不用网站做淘宝客备案的时候需要网站吗
  • 网站建设(信科网络)三好街网站建设与维护
  • 无锡江阴做网站公司搭建网站成本
  • 惠州网站建设一般多少钱南通网站建设入门
  • asp.net企业网站框架优化设计七年级上册语文答案
  • 辽宁省网站备案要求福州网站建设方案外包
  • 手机网页版网站开发公共事业管理专业教材建设研究 教学成果奖申报网站
  • 网站建设彩票网学编程哪个机构好
  • 团购汽车最便宜的网站建设网站建设开票多少个点
  • 网站类型有哪些对网站的建议
  • 网站开发用什么软件编程小目标网站建设
  • torrent种子搜索引擎北京网站优化技术
  • 网站制作费用多少钱渭南中学校园网站建设工作汇报
  • 做网站开什么端口电子商务网站建设与维护试题
  • 优化站诊断网站开发协议
  • 资阳市网站seo连锁销售平台
  • 网站设计怎么自学学php网站开发好吗
  • 2022做网站还能赚钱吗南昌网站建设好企业网站
  • 湖南长沙网站建设公司电话企业网站的一般要素包括
  • 口碑好的网站建设公司怎么查百度收录