当前位置: 首页 > news >正文

给有后台的网站做网页网站关键词 提醒

给有后台的网站做网页,网站关键词 提醒,wordpress下载主题,对网站建设展望为了提升问答对的提取能力并完善GUI,我们从以下几个方面进行改进: 增强文本清理和解析能力:确保能够更准确地识别问答对。 支持更多文件格式:除了现有的 .txt, .docx, 和 .pdf,可以考虑支持其他常见格式如 .xlsx 等。 优化GUI设计:提供更友好的用户界面,包括进度条、日…

为了提升问答对的提取能力并完善GUI,我们从以下几个方面进行改进:

增强文本清理和解析能力:确保能够更准确地识别问答对。
支持更多文件格式:除了现有的 .txt, .docx, 和 .pdf,可以考虑支持其他常见格式如 .xlsx 等。
优化GUI设计:提供更友好的用户界面,包括进度条、日志显示等。
错误处理和日志记录:增强错误处理机制,提供详细的日志记录。
以下是改进后的代码:

import os
import json
import fitz  # PyMuPDF
import docx
import re
import tkinter as tk
from tkinter import filedialog, messagebox, simpledialog
import logging
from threading import Thread# 设置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')def clean_text(text):""" 清理文本,去除多余的空白字符和标点符号 """text = re.sub(r'\s+', ' ', text)  # 合并多个空白字符text = re.sub(r'[^\w\s]', '', text)  # 去除标点符号return text.strip()def extract_qa_pairs_from_txt(file_path):with open(file_path, 'r', encoding='utf-8') as f:content = f.read()content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef extract_qa_pairs_from_docx(file_path):doc = docx.Document(file_path)content = []for para in doc.paragraphs:content.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:content.append(cell.text)for rel in doc.part.rels.values():if "textBox" in rel.target_ref:text_box = rel.target_partfor element in text_box.element.body:if element.tag.endswith('p'):content.append(element.text)content = '\n'.join(content)conte
http://www.yayakq.cn/news/361404/

相关文章:

  • 网站百度秒收珠海网站建设哪家公司好
  • 一个网站做多少关键词企业网站不备案会怎么样
  • 网站建设入门教学阿里云网站建设9元
  • 建设网站站点过程中家具网站建设需求
  • 深圳app网站建设门户建设目标
  • 企业网站制作策划书二手房网站谁做的更好
  • 遵义制作网站百度做的网站字体侵权吗
  • 镇江网站网站建设重庆石柱网站设计公司
  • 开办网站备案关键词排名点击软件推荐
  • 临沂吧网站建设免费简历模板可导出
  • 网站无法收录Wordpress循环一行3个div
  • 一那个网站可以做一建题网站技术方案说明
  • 用户体验好的网站开一个网站要花多少钱
  • 廊坊网站制作潍坊公司电话秋实网站建设
  • 做视频网站的公司有哪些网站网址查询ip
  • 中国互联网协会网站为什么找不到做网站的软件
  • 南充建网站wordpress菜单底部导航代码
  • 大足专业建站公司宁波网站建设报价多少
  • 拍卖行 网站建设高德地图是中国的还是国外的
  • wordpress数据量大网站访问备案期间的网站打开
  • 大型旅游网站源码 织梦一级造价工程师贴吧
  • 建设银行互联网网站首页怎么创一个网站赚钱
  • mysql的网站开发人和机械网站建设
  • 网站主页怎么做免费做电子邀请涵的网站
  • 直播网站制作wordpress tag.php
  • 代做淘宝网站100平米简约办公室
  • 做网站教程和维护网站核桃编程加盟费多少钱
  • 怎样在网站上做免费的推广新乡公司做网站
  • 首钢建设网站网站建设基础书籍
  • 西安app网站开发百度官网平台