当前位置: 首页 > news >正文

诸城企业网站建设网站建设成功案例书籍

诸城企业网站建设,网站建设成功案例书籍,江苏 网站集约化建设方案,网站建设合同性质C# .Net 使用 IText7 从PDF文件中提取出所有文本内容 【文 / 张赐荣】 首先在 Nuget 包管理器中,安装"itext7" 和 "itext7.font-asian"。 如果不安装 "itext7.font-asian" PDF 文件中有非Unicode编码的字符,将会抛出运行时异常:iText.IO.Excep…

C# .Net 使用 IText7 从PDF文件中提取出所有文本内容

【文 / 张赐荣】

首先在 Nuget 包管理器中,安装"itext7" 和 "itext7.font-asian"。
如果不安装 "itext7.font-asian" PDF 文件中有非Unicode编码的字符,将会抛出运行时异常:iText.IO.Exceptions.IOException:找不到 CMap iText.IO.Font.Cmap.UniGB-UTF16-H。安装好了这两个组件之后,使用以下代码,从PDF文件中提取出所有的文本。

using System;
using System.Collections;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
using System.Threading;
using System.Threading.Tasks;
using System.Runtime.InteropServices;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Layout;
using iText.Layout.Element;

namespace ConsoleApplication
{
public static class PDFTextExtractor
{
public static string ExtractText(string pdfFilePath)
{
//创建一个PdfReader对象,用来读取pdf文件
PdfReader pdfReader = new PdfReader(pdfFilePath);
//创建一个PdfDocument对象,用于操作pdf文档
PdfDocument pdfDocument = new PdfDocument(pdfReader);
//创建一个StringBuilder对象,来存储提取的文本
StringBuilder textBuilder = new StringBuilder();
//获取pdf文档的总页数
int pageCount = pdfDocument.GetNumberOfPages();
//遍历每一页
for (int i = 1; i <= pageCount; i++)
{
//获取当前页的PdfPage对象
PdfPage pdfPage = pdfDocument.GetPage(i);
//创建一个ITextExtractionStrategy对象,用于指定提取文本的策略
ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
//使用PdfTextExtractor类的GetTextFromPage方法,根据指定的策略提取当前页的文本
string pageText = PdfTextExtractor.GetTextFromPage(pdfPage, strategy);
//将提取的文本追加到StringBuilder对象中
textBuilder.Append(pageText);
}
//关闭PdfDocument对象
pdfDocument.Close();
//返回StringBuilder对象中的字符串
return textBuilder.ToString();
}
}
}
 

http://www.yayakq.cn/news/37313/

相关文章:

  • 网站标准字体样百度新闻首页新闻全文
  • 网站做数据分析个人网站备案备注信息
  • 软件下载页面制作秦皇岛做网站优化价格
  • 做网站编程语言如何查看网站cms系统
  • 公司做网站费用记到哪个科目如何做旅游休闲网站
  • 雄安邯郸网站制作多少钱图片管理平台wordpress
  • 直接进入网站的代码公众号同步到dede网站
  • 昆山营销型网站建设为什么wordpress在ie打开很慢
  • 建设工程质量安全管理体系网站游戏app开发费用一览表
  • python 网站开发 prf镇江外贸型网站建设
  • 网站前端做报名框代码娄底市城乡建设局网站
  • 莆田网站建设维护高端装饰公司网站设计
  • 门户网站建设要多少钱wordpress mysql 应用
  • 怎样申请一个免费的网站空间只做二手奢侈品的网站
  • 做58网站怎么赚钱人力资源公司网站建设方案
  • 好的淘客网站WordPress主题vieu破解版
  • 科技公司网站设计欣赏怎样做一个网页
  • 华为模板建站建设银行网站网址是什么
  • 网站建设审批网站建设公司薪酬
  • 织梦做的网站怎么加弹窗网站验证码文件
  • 怎么看一个网站用什么做的开发工程师网站开发工程师
  • 保定哪家做网站专业西安发布最新通知
  • 小说网站开发实录网站配色
  • 企业网站推广在哪里办鹿泉营销型网站制作价格低
  • 如何把地图放到自己做的网站上网站建设图片尺寸
  • 网站建设平台是干什么的wordpress推荐商品主题
  • 网站开发所使用的浏览器找灵感的网站
  • 芜湖中凡网站建设公司网络营销推广方案pdf
  • 怎么做网站图标钢管公司网站建设
  • 主机网站建设西安设计网站的公司