当前位置: 首页 > news >正文

wordpress建站实例网络营销可以做什么工作

wordpress建站实例,网络营销可以做什么工作,大气装饰公司网站源码,自己创办网站Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库,命令如下: pip install pdfminer3K 安装过程如下: 引入类库 需要引入很多的类库。 示例如下: import sys import importlib importlib.reload(sys)fr…

Python 实现读取pdf文件简单示例。

安装命令

需要安装操作pdf的三方类库,命令如下:

pip install pdfminer3K

安装过程如下:

引入类库

需要引入很多的类库。

示例如下:

import sys
import importlib
importlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import  PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

 

读取pdf实现

实现步骤为:先通过二进制方式打开测试pdf文档,创建pdf文档解析测试文档内容,

最后读取文件内容,保存到另一个文件中。

示例如下:

import sys
import importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
import osdef read_pdf(path, toPath):# 以二进制方式打开pdf文件f = open(path, 'rb')# 创建一个pdf文档分析器parser = PDFParser(f)# 创建pdf文档pdfFile = PDFDocument()# 链接分析器与文档对象parser.set_document(pdfFile)pdfFile.set_parser(parser)# 提供初始化密码pdfFile.initialize()# 检测文档是否提供txt转换if not pdfFile.is_extractable:raise PDFTextExtractionNotAllowedelse:# 解析数据# 数据管理器manager = PDFResourceManager()# 创建一个PDF设备对象laparams = LAParams()device = PDFPageAggregator(manager, laparams=laparams)# 解释器对象interpreter = PDFPageInterpreter(manager, device)for page in pdfFile.get_pages():interpreter.process_page(page)layout = device.get_result()for x in layout:if isinstance(x, LTTextBoxHorizontal):with open(toPath, 'a', encoding='utf-8') as f:print(x.get_text())f.write(x.get_text() + "\n")path = os.path.join(os.getcwd(), 'test_1.pdf')
toPath = os.path.join(os.getcwd(), 'test_2.txt')
read_pdf(path, toPath)

注意:无法读取中文,貌似需要加载中文字体。还有就是在写入pdf文件,格式不对无法打开暂时没找到原因。

总结

本篇只是使用Python 实现读取pdf文件简单示例,因为时间关系没有做深入的扩展,等之后有时间再做补充。

http://www.yayakq.cn/news/98963/

相关文章:

  • iis 网站设置把别人的图片拿来做网站
  • 团队协同网站开发免费公司logo设计
  • 别人做的网站域名到期怎么办网站首页列表布局设计
  • 长春做网站电话网站字体 font-family
  • shop后缀的网站企业招聘ppt模板免费
  • 网站建设方案规划书网站后台认证码
  • 楚雄做网站建设的公司企业网站建设策划书
  • 上海建设集团网站重庆宣网站建设
  • 备案网站能打开吗深圳 网站 设计
  • 山东宏福建设集团有限公司网站word+没有安装wordpress
  • 视频在线观看网站怎么建设企业网站建设和运营
  • 高端品牌网站建设案例镇江网站制作案例
  • 无锡军自考网站建设软件公司名字起名大全
  • 网站空间地址静态wordpress
  • 几个免费建立网站的平台网站开发者购物支付模板
  • 深圳模板建站平台高校门户网站的建设方案
  • 一个做服装品牌的网站做网站不赚钱了
  • 营销型网站策划设计外贸高端网站设计公司
  • 做自己的网站多少钱购物网站开发教程 视频
  • 网站开发 项目计划书有什么平台可以免费发布推广信息
  • iis 添加网站腾讯建站模板
  • 专门做设计文案的网站中国民航机场建设集团网站
  • vue做社区网站wordpress白天黑夜切换
  • 免费做店招的网站公众号平台登陆入口
  • seo外包优化网站网站建设世纪明珠
  • 直播网站开发技术哪个网站网站空间最好
  • 手机网站微信分享代码wordpress新闻站主题
  • 网站色调为绿色wordpress标签排序
  • 网站备案ip地址问答主题 WordPress
  • 网站建设备案是什么饭店网站模板