当前位置: 首页 > news >正文

生物科技 网站模板婚庆网站建设目的

生物科技 网站模板,婚庆网站建设目的,免费的网络推广平台,昆明市城乡建设局网站为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容: 增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。 确保输出文件的格式正确:每个 Q…为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容: 增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。 确保输出文件的格式正确:每个 QA 对占一行,且格式为 JSON。 以下是完善后的代码: import os import json import fitz # PyMuPDF import docx import re import tkinter as tk from tkinter import filedialog, messagebox, simpledialog import logging# 设置日志记录 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')def clean_text(text):""" 清理文本,去除多余的空白字符和标点符号,替换影响数据集的特殊字符 """text = re.sub(r'\s+', ' ', text) # 合并多个空白字符text = re.sub(r'[^\w\s]', '', text) # 去除标点符号text = re.sub(r'"', "'", text) # 替换双引号text = re.sub(r'\\', '/', text) # 替换反斜杠return text.strip()def extract_qa_pairs_from_txt(file_path):with open(file_path, 'r', encoding='utf-8') as f:content = f.read()content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef extract_qa_pairs_from_docx(file_path):doc = docx.Document(file_path)content = []for para in doc.paragraphs:content.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:content.append(cell.text)for rel in doc.part.rels.values():if "textBox" in rel.target_ref:text_box = rel.target_partfor element in text_box.element.body:if element.tag.endswith('p'):content.append(element.text)content = '\n'.join(content)content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef
http://www.yayakq.cn/news/3078/

相关文章:

  • 网站详情页用cdr做可以吗网页制作公司挣钱吗
  • 免费自助建站排名wordpress 4.9 站群
  • 出版社网站建设网站的网络推广
  • 司瓦图网站编写app
  • 传播型网站建设优势有哪些唐山建网站的公司
  • 自己做的网站程序怎么发布深圳互联网设计开发
  • 公司如何建站萧山区seo关键词排名
  • 网站用什么开发软件做wordpress评论不了
  • 做资源网站做网站需要什么语言
  • php购物网站开发设计与实现wordpress 成功案例
  • 做的不错的网站公司网站可以个人备案吗
  • 南宁大型网站推广公司wordpress mip提交
  • 提供常州网站优化邯郸招聘信息最新招聘
  • 坪地网站建设教程免费做h5的网站有哪些
  • 网站友情链接建设软文营销的本质
  • 学做炒菜的网站广安发展建设集团官方网站
  • 机关公文写作网站做网站的财务需求
  • 网站建设图片大小肇庆专业网站建设公司
  • 东营网站建设那家好网站维护会导致打不开网页吗?
  • 绍兴公司做网站响应式 官网网站
  • 做网站 对方传销做网站文字编辑好不好
  • 手机网站 微信链接怎么做规模以上工业企业总产值
  • 射阳做网站多少钱网站建设优化推广哈尔滨
  • 南昌网站建设公司价位网络维护员主要什么工作
  • 石家庄谁会搭建网站廊坊学校网站建设
  • 新网如何管理网站WordPress HTML标签验证
  • 网站开发的服务器是什么哈尔滨招标信息网
  • 福田做棋牌网站建设哪家好动漫制作与设计专业
  • 百度站点管理网站首页做一点开有动画
  • 专业网站设计报价网站建设公司销售