当前位置: 首页 > news >正文

a5站长网网站交易网站建设论文框架

a5站长网网站交易,网站建设论文框架,seo网站优化方案书,南宁网站建设培训有哪些我的数据是先把url链接获取到存入excel中,后续对excel做的处理,各位也可以直接在程序中做处理,下面就是针对excel中的链接做批量处理 excel内容格式如下(涉及具体数据做了隐藏) 标题文件链接文件日期网页标题1http://…

我的数据是先把url链接获取到存入excel中,后续对excel做的处理,各位也可以直接在程序中做处理,下面就是针对excel中的链接做批量处理
excel内容格式如下(涉及具体数据做了隐藏)

标题文件链接文件日期
网页标题1http://www.aaabbbcc.com.cn2024.2.5

在这里插入图片描述
代码逻辑:先读取excel文件内容,循环转换每一行的链接
具体代码示例:

注意:pdfkit,wkhtmltopdf一般情况下是需要安装的,已安装的忽略,wkhtmltopdf需要去官网下载安装包手动安装才可以
wkhtmltopdf下载:https://wkhtmltopdf.org/downloads.html
安装pdfkit,wkhtmltopdf

pip install pdfkit
pip install wkhtmltopdf 

官网下载wkhtmltopdf
在这里插入图片描述

# 将链接的网页保存为 PDF
import pdfkit
import pandas as pd
#读取excel
df=pd.read_excel(r'D:\WeChat\WeChat Files\wxid_ec4y3bp7rexo22\FileStorage\File\2024-02\示例数据.xlsx')
#循环获取每一行数据
for index, row in df.iterrows():url = row['文件链接'] #获取url#配置wkhtmltopdf环境,如果在系统环境变量中已经存在可以忽略,为保证代码生效建议配置config = pdfkit.configuration(wkhtmltopdf=r'D:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe')#调用URL并保存pdf,这里我把标题设置为pdf的文件名,具体设置看个人哈pdfkit.from_url(url, r'E:\1-work\模型\爬取数据文档\pdf\{}.pdf'.format(row['标题']), configuration=config)

运行完成!!!
在这里插入图片描述

http://www.yayakq.cn/news/831103/

相关文章:

  • 门户网站建设需要多少钱手机兼职在哪个网站做
  • html 手机网站go做的网站
  • 律师事务所公司类网站建设案例网站公司源码
  • 网站建设厦门东营招标信息网官网首页
  • 青岛网站建设青岛新思维wordpress 修改 注册
  • 济宁市城市建设局网站网站建设方案书制作流程
  • 网站推广优化方式win2003搭建wordpress
  • 个人可以做网站维护吗绍兴网站制作价格
  • 网站内容页面怎么做的服装电子商务网站设计
  • 企业网站建设方案书范本公司建站模版
  • ps联盟网站西餐厅网站建设的需求分析
  • 乔拓云智能建站免费注册WordPress 蜘蛛检测
  • 景区网站建设要求公司注册网上核名用哪个方式注册
  • 化妆品公司网站建设方案wordpress主机建站
  • 当牛做吗网站源代码分享百度云中国建设招标网网站
  • 万户网站建设wordpress 首页访问量
  • 珠海新盈科技网站建设我要自学网官方网站
  • 网站建站建设联系电话做家教网站的资源是什么
  • 免费的网站软件体育网站模版
  • 那些彩票广告网站怎么做的中国人社app下载安装
  • 网站更换主机注意广西桂林地图
  • 手机视频网站开发网站开发如何入账
  • 哈尔滨建设网站公司哪家好百度关键词排名软件
  • 谷德设计网站官网入口node.js做网站好累
  • r语言网站开发源码之家打不开
  • 足球网站开发比较好的网站开发
  • 英语培训东莞网站建设可以自己做图的网站
  • 网站规划模板中国十大小说网站排名
  • 做的网站怎样评估价值电子商务方案设计案例
  • 专门做当归的网站建设医院官方网站