当前位置: 首页 > news >正文

北京网站建设还公司什么购物软件好用

北京网站建设还公司,什么购物软件好用,大气企业网站织梦模板,机房建设网站模板C# .Net 使用 IText7 从PDF文件中提取出所有文本内容 【文 / 张赐荣】 首先在 Nuget 包管理器中,安装"itext7" 和 "itext7.font-asian"。 如果不安装 "itext7.font-asian" PDF 文件中有非Unicode编码的字符,将会抛出运行时异常:iText.IO.Excep…

C# .Net 使用 IText7 从PDF文件中提取出所有文本内容

【文 / 张赐荣】

首先在 Nuget 包管理器中,安装"itext7" 和 "itext7.font-asian"。
如果不安装 "itext7.font-asian" PDF 文件中有非Unicode编码的字符,将会抛出运行时异常:iText.IO.Exceptions.IOException:找不到 CMap iText.IO.Font.Cmap.UniGB-UTF16-H。安装好了这两个组件之后,使用以下代码,从PDF文件中提取出所有的文本。

using System;
using System.Collections;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
using System.Threading;
using System.Threading.Tasks;
using System.Runtime.InteropServices;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Layout;
using iText.Layout.Element;

namespace ConsoleApplication
{
public static class PDFTextExtractor
{
public static string ExtractText(string pdfFilePath)
{
//创建一个PdfReader对象,用来读取pdf文件
PdfReader pdfReader = new PdfReader(pdfFilePath);
//创建一个PdfDocument对象,用于操作pdf文档
PdfDocument pdfDocument = new PdfDocument(pdfReader);
//创建一个StringBuilder对象,来存储提取的文本
StringBuilder textBuilder = new StringBuilder();
//获取pdf文档的总页数
int pageCount = pdfDocument.GetNumberOfPages();
//遍历每一页
for (int i = 1; i <= pageCount; i++)
{
//获取当前页的PdfPage对象
PdfPage pdfPage = pdfDocument.GetPage(i);
//创建一个ITextExtractionStrategy对象,用于指定提取文本的策略
ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
//使用PdfTextExtractor类的GetTextFromPage方法,根据指定的策略提取当前页的文本
string pageText = PdfTextExtractor.GetTextFromPage(pdfPage, strategy);
//将提取的文本追加到StringBuilder对象中
textBuilder.Append(pageText);
}
//关闭PdfDocument对象
pdfDocument.Close();
//返回StringBuilder对象中的字符串
return textBuilder.ToString();
}
}
}
 

http://www.yayakq.cn/news/235168/

相关文章:

  • 快速刷网站排名宁德市蕉城区
  • 深圳网站制作公司专业网站城市建设局网站
  • 设计素材网站的问卷调查做网站优化期间能收到网站吗
  • 自助网站建设工具杨凌做网站
  • 上海小企业网站建设平台网络广告策划案例
  • xz域名网站轻量级WordPress
  • c2c的电子商务网站有哪些西安网站托管维护
  • 有关网站建设的网站如何设计网络
  • 灰系网站昆明app开发哪家好
  • 网站分类标准dede网站首页
  • 南阳网站排名优化自己做网站 需要哪些东西
  • 网站建设的一般步骤面试简历模板免费
  • 怎么做学校子网站网上学编程的有哪些比较好的网站
  • 做网站找 汇搜网络去哪家装修公司
  • 企业内部网站模板毕设代做的网站
  • 制作网站公司哪里好wordpress木马检测
  • 广州做鞋的网站wordpress关于页面
  • 网站对位山东企业网站建设公司
  • 广东官方网站建设智能物联网综合管理平台
  • 网站建设方案步骤wordpress进入不了后台
  • 做宽屏网站网站如何做视频教程
  • 江苏省交通建设质监网站wordpress主题自定义添加后台设置
  • 做网站推广的是什么职位荆州seo优化
  • 做网站的开发心得app开发与网站开发的区别
  • 北京西城网站建设公司深圳市建设集团和恒大的关系
  • 汕头优化网站wordpress禁止ip评论
  • 洪洞网站建设阳谷聊城做网站
  • 关于电子商务网站建设与管理的论文wordpress音频播放器插件
  • 平谷做网站手机wap网站 php
  • ps软件下载官方网站有什么网站可以做设计兼职