当前位置: 首页 > news >正文

营销型网站优化电子商务公司网站设计

营销型网站优化,电子商务公司网站设计,张家港保税区规划建设局网站,学习网站建设好找工作吗bookroo网页上有很多不错的英文图书书目。比如这个关于儿童花样滑冰的书单: https://bookroo.com/explore/books/topics/ice-skating 怎么批量下载下来呢? 这个网页是动态网页,要爬取下来比较麻烦,可以先查看源代码,…

bookroo网页上有很多不错的英文图书书目。比如这个关于儿童花样滑冰的书单:

https://bookroo.com/explore/books/topics/ice-skating

怎么批量下载下来呢?

这个网页是动态网页,要爬取下来比较麻烦,可以先查看源代码,然后把源代码保存到本地e盘:DOCTYPE html.htm

打开这个源代码文件:

仔细看,书籍信息在json对象里面:

问ChatGPT如何提取这些书籍名称:

如何从以上网页源代码中提取出title的内容,比如提取出"title":"Mice Skating"、title":"Flora and the Penguin"中的:Mice Skating、Flora and the Penguin

ChatGPT的回复:

你的问题描述中的内容看起来像是一段JSON格式的数据,而不是HTML源代码。这是一个JSON对象,其中包含一个"books"的列表,每个列表项又是一个包含各种属性(包括"title")的字典。

为了提取"title"的内容,你可以首先将这个JSON字符串转换为Python的数据结构,然后遍历"books"列表,提取每个书籍的"title"。以下是一个例子:

import json

# 这是你的JSON字符串。我已经将其稍微清理过了。

json_str = '''

{

"props": {

"pageProps": {

"initialData": {

"pages": [

{

"books": [

{

"title": "Flora and the Penguin",

...

},

{

"title": "Mice Skating",

...

},

...

]

}

]

}

}

}

}

'''

# 将JSON字符串转为Python数据结构

data = json.loads(json_str)

# 遍历"books"列表

for page in data['props']['pageProps']['initialData']['pages']:

for book in page['books']:

# 提取并打印"title"

print(book['title'])

注意:我在JSON字符串中使用了省略号("...")来表示你的原始数据中还有更多的内容。在实际使用中,你应该用你的完整的JSON字符串替换json_str的值。

将所有的JSON字符串复制到json_str = ''' ''' 里面,运行程序,成功获取到页面的所有图书名称:

http://www.yayakq.cn/news/728731/

相关文章:

  • 作风建设网站首页网站高端建设开发公司
  • 青岛做外贸网站包头市
  • 建立站点的基本步骤手表网站十大品牌
  • 临汾推广型网站开发wordpress怎么和手机连接数据库
  • 男女做那个的视频网站做影视后期应该关注哪些网站
  • 网站建设实践报告富阳网站优化
  • 互联网网站排名深圳品牌营销咨询公司
  • 网站开发空间小wordpress 插件 下载
  • 网站优化效果查询防做电脑租赁网站
  • 网站备案查询工信部ui界面图标
  • 做网站的能赚多少钱网站备案的要求
  • 网站制作 杭州wordpress小工具怎么调整漂亮
  • 企业网站推广的方法租用服务器
  • 建设部网站注册人员手机端怎么看世界杯
  • 手机版网站开发公司首页关键词排名优化
  • 制作网站软件下载青岛永诚网络有限公司
  • 福建省城乡建设网站六安网红
  • 常州企业自助建站网站推广阶段
  • 做网站的流程方法沧州科盛网络技术有限公司
  • 阿里云建网站费用wordpress 三站合一
  • 网站浮窗代码湖北省网站备案
  • 本地电脑做服务器 建网站流量平台有哪些
  • php商业网站制作如何办网站 论坛
  • 教育网站设制下载目前国际电商平台有哪些
  • 荆州网站建设厂家wordpress pc客户端
  • 柳市做网站沃尔玛网上商城app
  • 精品资源共享课网站建设做网站服务器用国外的
  • 自己可以创建网站吗网站改版 影响
  • 网站的色彩搭配如何有效推广
  • 免费进入电影网站人人网入口wordpress网站域名地址