当前位置: 首页 > news >正文

鲜花网站源码湖南昌正建设有限公司网站

鲜花网站源码,湖南昌正建设有限公司网站,seo技术培训茂名,中文版网站建设费用利用python的爬虫功能进行信息爬取,关键在于源码分析,代码相对简单。 1 源代码分析 访问网站,按下F12,进行元素查找分析。 2 代码实现 from requests import get from bs4 import BeautifulSoupdef getXhuNews(pageNum1):&qu…

利用python的爬虫功能进行信息爬取,关键在于源码分析,代码相对简单。

1 源代码分析

访问网站,按下F12,进行元素查找分析。

2   代码实现

from requests import get
from bs4 import BeautifulSoupdef getXhuNews(pageNum=1):"""获取西华大学新闻信息"""url="http://news.xhu.edu.cn/zhxw/list%d.htm"%(pageNum)print(url)response=get(url)if (response.status_code==200):print("顺利获取数据")else:print("目的网站无法连接")exit();response.encoding = 'utf8'html=response.textsoup=BeautifulSoup(html,"html.parser")#myTitle=soup.select(".news_title")              #根据class查找结点(会找出太多的div)myTitle=soup.find_all("div",{"id":"wp_news_w6"}) #根据div的id查找结点soup = BeautifulSoup(str(myTitle),"html.parser") #重新构造soupmyTitle=soup.select(".news_title")               #根据class查找结点(会找出太多的div)  myDate=soup.select(".news_meta")                 #根据class查找结点print("第%d页"%pageNum," ",len(myTitle),"条新闻")listDate=[]     #存储日期listTitle=[]    #存储标题listHref=[]     #存储连接for i in myTitle:soup = BeautifulSoup(str(i),"html.parser")   #重新构造soups=soup.select("a")                           #根据标签获取结点for x in s:listHref.append(x["href"])               #获取结点属性值listTitle.append(x.getText())            #获取属性文本for i in myDate:soup = BeautifulSoup(str(i),"html.parser")   #重新构造soups=soup.select("span")                        #根据标签获取结点for x in s:listDate.append(x.getText())             #获取属性文本#写入文件fileName="text%05d.txt"%(pageNum)f=open(fileName,"w",encoding="utf8")for i in range(len(listDate)):str2="%04d"%(i+1)+"  "+listDate[i]+"  "+listHref[i]+"  "+listTitle[i]+"\n"f.write(str2)f.close()#----------使用样例---------------------------------
for i in range(40,50):getXhuNews(i)

http://www.yayakq.cn/news/651208/

相关文章:

  • 网站建设产品手册怎么做免费个人网站
  • seo优化网站推广全域营销获客公司wordpress在图片上加链接
  • 江西中企动力做的网站西点培训班一般要多少学费
  • 怎样自己做公司网站开发一块地需要多少钱
  • 广州祥云平台网站建设南宁建站公司有哪些
  • 做网站一条龙网站如何做自适应
  • 网站的建设方式wordpress代码恢复旧编辑器
  • 曲阜市古建设计院网站wordpress装饰
  • 专门提供做ppt小素材的网站网站建设 费用 入哪个科目
  • 企业自己做网站方法网站信管局备案
  • 最好的微网站建设公司如何在网站做宣传
  • 不用服务器做网站阿里巴巴网站建设与维护
  • 网站设计鉴赏263企业邮箱登官网
  • 上海美容论坛网站建设网上推销产品去什么平台
  • php二次网站开发步骤企业网站建设 总结
  • 域名制作网站吗wordpress纯图片主题
  • wordpress购物网站学校网站建设联系电话
  • 设置自己的网站西安优化网站公司
  • 给装修公司做推广的网站网站制作需要多少费用
  • 剑阁县规划和建设局网站小红书网站开发费用
  • 溧阳网站建设报价龙采网站建设案例
  • 口碑最好的购物网站平台html5网站开发环境的搭建
  • 淄博市住房和城乡建设局官方网站三类医疗器械
  • 网站技术解决方案南昌做网站的公司哪个比较好的
  • 广州开发网站设计网站快速备案安全吗
  • 网站的设计思路怎么写20平米小门店装修
  • 晋州做网站的联系电话价格低不是干粉灭火器的优点
  • 深圳外贸网站开发公司医院网站建设费用
  • 网站建设维护论文小程序商城源代码
  • 企业建设营销网站有哪些步骤变更网站备案信息