当前位置: 首页 > news >正文

新网站怎么做谷歌推广呢怀柔网站制作公司

新网站怎么做谷歌推广呢,怀柔网站制作公司,网站优化建设桂林,网易企业邮箱服务要在Python中标注PDF文件中的关键字,可以使用Python的PDFMiner库和Python的matplotlib库。 首先,需要安装这两个库。可以使用pip命令进行安装: shell 复制代码 pip install pdfminer.six matplotlib 接下来,可以使用以下代码实现…

要在Python中标注PDF文件中的关键字,可以使用Python的PDFMiner库和Python的matplotlib库。

首先,需要安装这两个库。可以使用pip命令进行安装:

shell
复制代码
pip install pdfminer.six matplotlib
接下来,可以使用以下代码实现关键字查找和标注功能:

python
复制代码
import pdfminer  
from pdfminer.high_level import extract_text  
from pdfminer.layout import LAParams  
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter  
from pdfminer.converter import TextConverter  
import io  
import matplotlib.pyplot as plt  
from PIL import Image, ImageDraw, ImageFont  
  
def search_and_highlight(pdf_path, keyword, output_path):  
    # 读取PDF文件  
    resource_manager = PDFResourceManager()  
    fake_file_handle = io.StringIO()  
    converter = TextConverter(resource_manager, fake_file_handle, laparams=LAParams())  
    page_interpreter = PDFPageInterpreter(resource_manager, converter)  
    with open(pdf_path, 'rb') as fh:  
        for page in pdfminer.pdfparser.PDFParser(fh).get_pages():  
            page_interpreter.process_page(page)  
        text = fake_file_handle.getvalue()  
    # 关闭打开的PDF文件和文本转换器  
    converter.close()  
    fake_file_handle.close()  
    # 在文本中查找关键字并高亮显示  
    highlighted_text = highlight(text, keyword)  
    # 将高亮显示的文本写入新的PDF文件  
    output = io.StringIO()  
    with open(output_path, 'w') as out:  
        out.write(highlighted_text)  
    # 显示带有高亮显示的文本的PDF文件  
    plt.imshow(Image.open(output), origin='lower')  
    plt.axis('off')  
    plt.show()  
  
def highlight(text, keyword):  
    words = text.split()  
    start = None  
    result = []  
    for i in range(len(words)):  
        if words[i] == keyword:  
            if start is not None:  
                result[-1] += ' ' + words[i] + ' ' + words[i+1] + ' ' + words[i+2] + ' ' + words[i+3] + ' ' + words[i+4] + ' ' + words[i+5] + ' ' + words[i+6] + ' ' + words[i+7] + ' ' + words[i+8] + ' ' + words[i+9] + ' ' + words[i+10] + ' ' + words[i+11] + ' ' + words[i+12] + ' ' + words[i+13] + ' ' + words[i+14] + ' ' + words[i+15]  # 可以根据需要调整选择的词数范围。例如,选择2个词或3个词。也可以使用其他逻辑来确定如何选择这些词。  
                start = None  
        else:  
            if start is None:  
                start = i  
    if start is not None:  
        result[-1] += ' '.join(words[start:])  # 如果最后一个匹配项后面还有文本,则将其添加到结果中。这可以防止在最后一个匹配项后面出现断句。  
    return result

http://www.yayakq.cn/news/202469/

相关文章:

  • 网站设置5个关键词成都网站建设有限公司
  • 鞍山公司做网站单位网站的建设
  • 想要注册一个公司网站怎么做科技公司最全经营范围
  • 网站主页与导航栏的设计网站改版阿里云怎么做网站301定向
  • 网站反链是什么意思怎么做网页代理
  • 流量对网站的作用wordpress去除手机版
  • 设备网站模板仿站工具下载后咋做网站
  • 更改wordpress用户名东莞宣布优化防疫措施
  • 网站设计工具更好的做网站三维立体网站建设
  • 安徽富通建设有限公司网站如何做响应式网站
  • 上海建站优化网站整合营销建设
  • 宝安网站制作培训网站建站网站496565
  • 网站建设是什么科目php网站建设培训班
  • 百度网站验证是地方型旅游网站
  • 天津移动网站建设seo顾问培训
  • 始兴生态建设网站怎么建设网站页面
  • 以用户为中心 建设学校网站网页制作模板保存
  • 临沂网站建设周口买卖友情链接
  • 创建网站模板网站按照规模分为哪几类
  • 公司网站主要几方面大型网站建设推广
  • 做网站的哪家比较好黄页88登录
  • 建设部网站投标保证金做网站需要了解什么东西
  • 苍南网站建设公司知名的网站开发公司
  • 怎么做一个网站 免费上海网站推广策划
  • 深圳罗湖网站设计手表哪个网站正品
  • 早教网站建设方案php网站截图
  • 做cpa建什么网站怎么根据街景图片找地址
  • 网站收缩栏公司简单网站多少钱
  • 单页网站做淘宝客做正品的网站
  • 宁波高端网站建设联系方式哪个网站建设好