当前位置: 首页 > news >正文

购物网站毕业设计论文系统集成

购物网站毕业设计论文,系统集成,电影网站是怎么做的,wordpress版 影视站文章目录 🍋引言🍋xlrd库和xlwt库🍋创建Excel文件🍋通过Python代码向Excel写入数据🍋案例实战 🍋引言 本节主要介绍一下在使用网络爬虫技术的时候,如何将数据存储到Excel中去 🍋xl…

文章目录

  • 🍋引言
  • 🍋xlrd库和xlwt库
  • 🍋创建Excel文件
  • 🍋通过Python代码向Excel写入数据
  • 🍋案例实战

🍋引言

本节主要介绍一下在使用网络爬虫技术的时候,如何将数据存储到Excel中去

🍋xlrd库和xlwt库

xlrd(XL Read)是一个用于读取Excel文件的Python库。它支持.xls和.xlsx格式的文件,并可以提取文件中的数据、格式和元数据等信息。xlrd提供了许多功能,包括选择特定的工作表、获取单元格的值和样式、遍历工作表中的数据等。它是一个强大的工具,可用于数据分析、数据提取和数据处理等任务。

xlwt(XL Write)是一个用于创建和写入Excel文件的Python库。它支持.xls格式的文件,并允许用户创建新的工作表、添加数据、设置单元格样式等。xlwt提供了易于使用的API,使得创建和编辑Excel文件变得简单。它适用于各种应用场景,如生成报告、创建数据可视化或自动化数据处理等。

两个库的在线安装命令如下

pip install xlrd
pip install xlwt

🍋创建Excel文件

创建文件的代码较为简单,如下

import xlwt
workbook = xlwt.Workbook(encoding='utf8')

在这里插入图片描述

但是我们平时创建一个Excel文件的时候下面会有表格(sheet),所以我们不光要创建Excel对象,而且需要创建若干sheet表格,具体代码如下

sheet1 = workbook.add_sheet('sheet1')
sheet2 = workbook.add_sheet('sheet2')
sheet3 = workbook.add_sheet('sheet3')

创建完表格后,最后一步就是保存

workbook.save(r"C:\Users\Administrator\Desktop\期中成绩.xls")

这个绝对路径,教大家一个查看方法,按住shift,鼠标右键
在这里插入图片描述
运行代码后在桌面就会出现一个Excel文件
在这里插入图片描述
点进去也会发现有三个sheet表格
在这里插入图片描述

🍋通过Python代码向Excel写入数据

这里我们注意,在Excel中每个单元格的坐标是字母+数字的组合
在这里插入图片描述
但是在Python中并不是这样,具体可以参考下图
在这里插入图片描述

不同之处我们知道了,接下来上代码

sheet1.write(0, 0, 'Math')
sheet1.write(0, 1, 'English')
sheet1.write(0, 2, 'Chinese')

运行后
在这里插入图片描述
接下来我们可以简单的为单元个填充成绩,这里我们可以采用循环

for row in range(1, 20, 1):for col in range(0, 3, 1):sheet1.write(row, col, random.randint(80, 100))

运行结果如下
在这里插入图片描述

🍋案例实战

这里我们将某博的热搜作为实战对象,首先我们需要准备一个爬取此网站前期的准备

# 导入模块
import requests
from bs4 import BeautifulSoup# 定义url和请求头
url =  'https://s.weibo.com/top/summary?display=0&retcode=6102'
_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36","Cookie": "SUBP=0033WrSXqPxfM72-Ws9jqgMF55529P9D9WW2kX-Z46lRbEGNeGGOqQzg; SINAGLOBAL=1879006065688.1335.1674544342950; UOR=,,www.baidu.com; SUB=_2AkMUum_nf8NxqwJRmP8cy2rkbYh1zQ_EieKi5p48JRMxHRl-yT9vqmEptRB6PzpBCFr8Nw9WHg85yXpbEGjv_BB4-91Q; _s_tentry=weibo.com; Apache=5265586173710.342.1689125693519; ULV=1689125693521:3:1:1:5265586173710.342.1689125693519:1675905464675"}# 发送请求
response = requests.get(url,headers=_headers)
content = response.content.decode('utf8')
# 实例化对象
soup = BeautifulSoup(content, 'lxml')# 提取数据
tds = soup.find_all('td',class_="td-02")[1:]
weibos = []
for td in tds:# 内容event = td.find_all('a')[0].string  # 只把对象里面的内容提取出来# 热度hot = td.find_all('span')[0].stringweibo = {"event": event,"hot": hot}weibos.append(weibo)
print(weibos)

上面我们采用bs4进行热搜的爬取

之后我们创建一个新的Excel表格,并将sheet表格命名为微博

workbook = xlwt.Workbook(encoding='utf8')
sheet1 = workbook.add_sheet('微博')

之后我们可以使用keys进行打印出我们需要的标题

print(weibos[0].keys())

运行结果如下
在这里插入图片描述
之后我们使用zip函数搭配for循环

keys = weibos[0].keys()
for i, key in zip(range(len(keys)),keys):sheet1.write(0, i, key)

最后我们将爬取的数据导进去

for row in range(1, len(weibos)+1, 1):for col, key in zip(range(len(keys)), keys):sheet1.write(row, col, weibos[row-1][key])

我来讲解一下上段代码:外循环主要是行循环,range里面主要len(weibos)要加一,要不然最后一个热搜导不进去;二层循环每次将event和hot分别插入Excel中

运行结果如下
在这里插入图片描述
下节我们介绍存储为CSV文件
请添加图片描述

挑战与创造都是很痛苦的,但是很充实。

http://www.yayakq.cn/news/260307/

相关文章:

  • wordpress无域名建站网络营销策略和营销策略的区别
  • 公司建设网站的意义erp系统要学多久
  • 泰州建站免费模板重庆网站制作设计获客
  • 黄金路网站建设公司公司网站开发需要做哪些事
  • 潍坊网站建设工作室宝安做棋牌网站建设哪家便宜
  • 潍坊市网站蜜雪冰城网络营销方案
  • 网站策划运营方案长沙市有什么好玩的旅游景点
  • 怎么做网站凡科江苏省网站备案查询
  • 开网店要建网站 一起的吗阿里巴巴外贸学院
  • 广州在线图文网络科技中心网站建设摄影网站官网大全
  • 蒙特网站建设公司5188关键词挖掘
  • 网站建设项目预算表wordpress 代码生成
  • 网站创建桌面快捷方式在哪里申请网站域名
  • wordpress博客站点清欢互联网网站建设
  • 网站建设需求书模板淘宝商城网站建设
  • php做网站的重点wordpress justmedia
  • 哪个网站可以做链接南京网站开发招聘
  • 商丘网站建设的公司哪家好四川成都现在可以去吗
  • 宁波厂家关键词优化网站seo是啥
  • 域名对网站建设有什么影响吗软件开发需求发布平台
  • 阿里云快速备份网站网页传奇游戏怎么注销
  • 建网站需要哪些资质找客网怎么样
  • 上海网站建设-中国互联中国机械采购平台
  • 做ps的网站有哪些功能吗锦州市网站建设
  • 可以用来做简单的网络验证的网站软件设计与开发
  • 云南旅行社网站开发中环互联网网站建设套餐
  • 眉山网站建设兼职fzzz主题wordpress
  • 东莞哪家建网站公司好用wordpress搭建知名网站
  • 个人网站logo中国建设银行网站对公业务流程
  • 电子政务门户网站建设的教训网站开发能赚钱吗