当前位置: 首页 > news >正文

jsp网站建设项目实战总结免费换ip软件

jsp网站建设项目实战总结,免费换ip软件,网站ui设计欣赏,网站建设与管理可以专升本吗文章目录 专栏导读背景测试代码分析请求网址请求参数代码测试数据分析利用lxml+xpath进一步分析将获取链接再获取文章内容测试代码写入word完整代码总结专栏导读 🔥🔥本文已收录于《Python基础篇爬虫》 🉑🉑本专栏专门针对于有爬虫基础准备的一套基础教学,轻松掌握Py…

文章目录

  • 专栏导读
  • 背景
  • 测试代码
    • 分析
    • 请求网址
    • 请求参数
    • 代码测试
  • 数据分析
    • 利用lxml+xpath进一步分析
  • 将获取链接再获取文章内容
    • 测试代码
  • 写入word
  • 完整代码
  • 总结

在这里插入图片描述

专栏导读

🔥🔥本文已收录于《Python基础篇爬虫》

🉑🉑本专栏专门针对于有爬虫基础准备的一套基础教学,轻松掌握Python爬虫,欢迎各位同学订阅,专栏订阅地址:点我直达

🤞🤞此外如果您已工作,如需利用Python解决办公中常见的问题,欢迎订阅《Python办公自动化》专栏,订阅地址:点我直达

🔺🔺此外《Python30天从入门到熟练》专栏已上线,欢迎大家订阅,订阅地址:点我直达

背景

  • 由于我最近想学习关于人民网的一些信息,我看到页面有三个模块,分别是【最新】【国内】【国际】,于是我想获取这三个模块的文章,并写入word文档中

测试代码

分析

1、首先我们发现请求响应的返回不在【Response】中,而是直接在网页中

2、我们发现网页中有三个【li】标签,分别表示【最新】【国内】【国际】中的文章url

3、所以我们决定此次爬虫应该是用 lxml+xpath比较合适,说干就干!

在这里插入图片描述

请求网址

url: http://jhsjk.people.cn/

请求参数

代码测试

# -*- coding: UTF-8 -*-
'''
@Project :人民网爬虫 
@File    :main_.py
@IDE     :PyCharm 
@Author  :一晌小贪欢(278865463@qq.com)
@Date    :2024/3/3 11:54 
'''
import jsonimport requestsurl = 'http://jhsjk.people.cn/'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'}res_data= requests.post(url=url, headers=headers)
# print(res_data.text)
res_data.encoding = "utf-8"
print(res_data.text)

数据分析

利用lxml+xpath进一步分析

在这里插入图片描述

我们看见每一个 文章链接在a标签中文章标题在span标签中

知道这个就好办了!

先利用lxml获取所有的【li】

news_data = tree.xpath('//div[@class="news-box"]//div[@class="news"]//ul//li')

获取文章链接

url_data = i.xpath('a/@href')[0]

获取标题

title = i.xpath('a/span')<
http://www.yayakq.cn/news/508892/

相关文章:

  • 网站开发建议白银做网站的董事
  • dede手机网站教程网站开发项目的简介
  • 北京网站制作建设wordpress启用域名邮
  • 高端交互式网站建设大型的网站开发
  • 成都游戏网站建设介绍兰州的网页
  • 无锡网站排名优化费用泉州专门做网站
  • 集团网站制作公司公司网站建设哪儿济南兴田德润实惠吗
  • 广西住房和城乡建设门户网站南阳网站排名公司
  • 肇庆百度网站推广科技前沿
  • 郴州建设局门户网站广东新闻联播今天
  • 长宁区网站建设设计如何开网店
  • 公司网站有什么作用网站域名邮箱
  • 怎么做lol网站如何引流与推广
  • iis搭建网站教程win7公司做阿里巴巴网站要多少钱
  • 石家庄网站建设团队国内做外贸网站的有哪些资料
  • 手机搭建个人网站建设田达摩托车官方网站
  • 新媒体 网站建设 影视做网站的用处
  • 洛阳市政建设网站做网站的图片分类
  • 为学校建设网站南昌网站开发模板
  • 专门做问卷调查的一个网站电视墙装修效果图2023新款
  • 做360网站优化排wordpress远程图片
  • 电子商务网站建设的方法和工具注册公司网站源码
  • 网站重新设计需要多久旅游网站建设策划书案例
  • 现代网站制作哪些网站做平面设计素材
  • 厦门网站建设公司排名电子商务网站建设类论文
  • 如何自己学做网站南京网站建设开发
  • 一元购物网站怎么做怎么做网站模块
  • 成都市温江建设局网站山东天元集团有限公司
  • 网站 关键词东莞网站建设哪家公司好
  • 哪个网站做推广好wordpress 文章目录插件免费版