当前位置: 首页 > news >正文

网站维护优化单位网站建设费用支出账务处理

网站维护优化,单位网站建设费用支出账务处理,合肥网站制作网站,王也微信头像图片本次爬虫案例使用Python语言编写,使用了requests库进行网页请求,使用了BeautifulSoup库进行网页解析,使用了openpyxl库进行数据的保存。 案例中的爬虫目标是豆瓣电影Top250,通过循环访问不同页面进行数据的爬取。在每个页面上&am…

本次爬虫案例使用Python语言编写,使用了requests库进行网页请求,使用了BeautifulSoup库进行网页解析,使用了openpyxl库进行数据的保存。

案例中的爬虫目标是豆瓣电影Top250,通过循环访问不同页面进行数据的爬取。在每个页面上,使用requests库发送GET请求,并设置合适的请求头,以避免被网站屏蔽。然后使用BeautifulSoup库解析返回的HTML响应,提取出需要的电影信息。

电影信息包括电影名称、排名和简介。通过解析HTML结构,使用find方法获取到对应的元素,然后提取出文本内容。提取到的信息存储在一个列表中,然后通过openpyxl库将信息逐行写入Excel文件的工作表中。

最后,使用workbook.save方法将数据保存到名为"douban_movie_top250.xlsx"的Excel文件中。

需要注意的是,在实际爬取数据时,应该遵循网站的robots.txt规范,并避免对网站造成过大的负担。另外,豆瓣电影Top250是一个公开的网页,但对于其他网站,可能需要进行登陆或者处理反爬机制。

以下是一个简单的Python爬虫案例,用于爬取豆瓣电影Top250的数据,并保存到Excel文件中。 

import requests
from bs4 import BeautifulSoup
import openpyxl# 创建工作簿和工作表
workbook = openpyxl.Workbook()
sheet = workbook.active
sheet.title = 'Top250'# 爬取数据
url = 'https://movie.douban.com/top250'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}for i in range(10):params = {'start': i * 25}response = requests.get(url, headers=headers, params=params)soup = BeautifulSoup(response.text, 'html.parser')# 解析数据movies = soup.find_all('div', class_='info')print(movies)for movie in movies:title = movie.find('span', class_='title').textrank = movie.find('a')["href"]info = movie.find('div', class_='bd').p.text.strip().split('\n')[0]sheet.append([title, rank, info])# 保存数据到Excel文件
workbook.save('douban_movie_top250.xlsx')
workbook.close()

excle数据预览:

关注公众号「码农园区」,获取多个项目源码及各大厂学习面试资源
在这里插入图片描述

http://www.yayakq.cn/news/707691/

相关文章:

  • 如东县文化馆网站建设做品牌文化的网站
  • 创意视觉网站Wordpress使用ldap
  • 阿里网站建设App开发c 做网站简单吗
  • 官方网站建设教程公司简介模板简洁大方
  • 百度做网站推广多少钱浙江华临建设集团有限公司网站
  • 全球设计网站自己的网站怎么做跳转
  • 合肥网站空间广州网站排名优化
  • 卡纸做荷花网站美食网站建设策划书
  • 中国建设银行官方网站 认证百度图片搜索图片识别
  • 网站开发存在的风险马尼拉做网站
  • 网站标题栏php简易购物网站开发
  • 国外做的好的医疗网站设计郑州论坛官网
  • 做一个15页的网站怎么做企业网站示例
  • 公司建网站的步骤是什么网站怎么建设?
  • 陕西网站建设公司找哪家好python基础教程电子版
  • 网站没有icp备案怎么访问什么网站类型
  • 天水 网站建设公司名字大全2022
  • 南京电信网站空间扩容做国际网站有什么需要注意的
  • 吉林省建设监理协会网站诚信建设网推怎么做
  • 做网站收款支付宝接口网站建设买服务器价格
  • 做静态网站需要什么保障网装修平台
  • 卖老石器老榆木做哪个网站好建站如何注重内容建设
  • 网站注册协议今年国内重大新闻
  • 个人电台网站模版织梦怎么修改网站标题
  • 做美食网站的优势图片设计师网站
  • 做哪方面的网站微信借口的网站怎么做
  • 如何查看网站流量网站在线演示
  • 国外家谱网站的建设个人社保缴费证明在哪里下载
  • 网站设计科技有限公司网站推广怎么写
  • 苏州网站 建设 公司网站页面引导怎么做