当前位置: 首页 > news >正文

学校网站建设发展概况分析广州网站设计有哪些专业

学校网站建设发展概况分析,广州网站设计有哪些专业,企业网站规划要求,优秀国外网站设计赏析文章目录 目录搜索 os、shutil库数据爬虫 request、re作业:爬取案例的top250电影的关键信息(名称、类型、日期),并保存在表格中 目录搜索 os、shutil库 os 模块提供了非常丰富的方法用来处理文件和目录。 os.listdir(path)&#x…

文章目录

  • 目录搜索 os、shutil库
  • 数据爬虫 request、re
  • 作业:爬取案例的top250电影的关键信息(名称、类型、日期),并保存在表格中

目录搜索 os、shutil库

os 模块提供了非常丰富的方法用来处理文件和目录。
os.listdir(path):返回path指定的文件夹包含的文件或文件夹的名字的列表。
os.path 模块:获取文件的属性信息。
os.path.join(path1[, path2[, …]]):把目录和文件名合成一个路径
os.path.isdir(path) :判断路径是否为目录
os.path.isfile(path):判断路径是否为文件
shutil.move(file,target):移动文件

# 深度优先搜索文件 (目录搜索)import os # 导入os模块
import shutil # 实现移动文件的功能需要# path代表待搜索的目录路径,result存储搜索到的文件路径列表
def dfs(path, result):child_files = os.listdir(path)for child in child_files:# 使用join拼接子目录或文件的路径child = os.path.join(path, child)# 将child保存到resultresult.append(child)if os.path.isdir(child):dfs(child, result)files = []
dfs('.', files)# 遍历files
for file in files:print("find %s" %file) #打印搜索到的路径if(os.path.isfile(file) and file.endswith('.xlsx')):# 移动当前目录下的excel文件到excel目录下shutil.move(file, '.\excel')

移动前:
在这里插入图片描述
移动后:
在这里插入图片描述

数据爬虫 request、re

网页数据爬虫实现了互联网网页自动化下载与自动化解析。通过爬虫,可以下载和分析网页。

# 网络爬虫# spider.py:网页下载、链接提取、数据存储
# 查看豆瓣网top250(25页,每页25条)的电影简介地址,换行存入到txt中import requests
import reurl = "https://movie.douban.com/top250?start="
pageSize = 25
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36"
}
# 正则匹配
briefUrl = "https://movie.douban.com/subject/[0-9]+/"
txt = open("douban.txt", "a", encoding="utf-8")# 爬取10页
for page in range(0, 10):resp = requests.get(url + str(page * pageSize), headers=headers)resp.encoding = "utf-8"# print(resp.text)# 通过findall从网页中提取符合briefUrl正则规则的网址links = re.findall(briefUrl, resp.text)# 去重arr = set(links)# print(links)for l in arr:# print(l)txt.write(l + "\n")
txt.close()

在这里插入图片描述

作业:爬取案例的top250电影的关键信息(名称、类型、日期),并保存在表格中

在这里插入图片描述

http://www.yayakq.cn/news/901464/

相关文章:

  • 如何免费建立一个网站百度用户服务中心
  • DW做旅游网站毕业设计做网站还有搞头吗
  • 网站平台建设情况汇报网络营销推广及优化方案
  • 自己做一个网站一年的费用网站优化目标
  • 网站建设788ggwordpress 主题文件
  • 房山网站建设服务wordpress adsense插件
  • 只做一种产品的网站用织梦做网站有什么公司会要
  • 一元夺宝网站制作视频设计图纸平面图
  • 怎样用自己电脑做网站东莞的网站建设
  • 免费自助搭建网站上海网站建设领导品牌
  • 嘉兴市住房和城乡建设局门户网站网址大全页面设置在哪
  • 常州微信网站建设服务dede网站版权信息修改
  • 网站维护的协议wordpress crossapple
  • 听歌网站源码网站排名怎么做 知乎
  • 做58同城网站花了多少钱wordpress英文显示改中文字体
  • 网站设计与网站建设营销型网站建设的小技巧
  • 东莞网站建设上科网页设计素材电影
  • 漂亮企业网站源码网站收录不好怎么办
  • 来宾住房和建设局网站手机网站适合分开做
  • 公司网站建设价更新目录wordpress
  • 住房和建设执业资格注册中心网站加油站网站大全
  • 河源市住房和城乡规划建设局网站小企业管理软件排名
  • 网站 空间地址是什么七牛云可以做网站的存储空间吗
  • 上海公共招聘网个人简化版防城港seo公司
  • 永久免费建站系统wordpress安装文件
  • 哪个网站的图片专门做详情页的搜索引擎营销总结
  • 雪域什么网站是做电影的百度推广有哪些形式
  • hm网上商城seo和sem是干什么的
  • 找人做网站需要注意问题新手如何做网站维护
  • 有那个网站可以做免费的投票wordpress主题免费中文版