当前位置: 首页 > news >正文

巫溪网站建设努力把网站建设成为

巫溪网站建设,努力把网站建设成为,seo技术推广,网站整站开发教程目录 概述 演示效果 核心逻辑 使用方式 1.裁剪数据集 根据自己的需要选择 2.用couplet数据集训练模型 模型存储在model文件夹中 3.将模型转换为ONNX格式 4.打开index.html就可以在前端使用此自动对对联系统了。 本文所涉及所有资源均在传知代码平台可获取。 概述 这个生成器利用…

目录

概述

演示效果

核心逻辑

使用方式

1.裁剪数据集

根据自己的需要选择

2.用couplet数据集训练模型

模型存储在model文件夹中

3.将模型转换为ONNX格式

4.打开index.html就可以在前端使用此自动对对联系统了。


本文所涉及所有资源均在传知代码平台可获取。

概述

这个生成器利用预训练的BERT模型,通过微调来生成中国对联。对联是一种中文传统文化形式,通常由上下联组成,具有一定的韵律和意境。

演示效果

在这里可以插入动图展示您的程序运行效果

核心逻辑

在这里可以粘贴您的核心代码逻辑:

# start
class CoupletDataset(Dataset):
    def __init__(self, data_path, tokenizer):
        self.data_path = data_path
        self.tokenizer = tokenizer
        self.inputs, self.labels = self.load_dataset()    def load_dataset(self):
        with open(self.data_path + '/in_cut.txt', 'r', encoding='utf-8') as fin, \
             open(self.data_path + '/out_cut.txt', 'r', encoding='utf-8') as fout:
            inputs = [line.strip() for line in fin.readlines()]
            labels = [line.strip() for line in fout.readlines()]
        return inputs, labels    def __len__(self):
        return len(self.inputs)    def __getitem__(self, index):
        input_text = self.inputs[index]
        label_text = self.labels[index]        input_tokens = tokenizer.tokenize(input_text)
        label_tokens = tokenizer.tokenize(label_text)        # 拼接成BERT模型需要的输入格式
        input_tokens = ['[CLS]'] + input_tokens + ['[SEP]']
        label_tokens = label_tokens + ['[SEP]']        # 将token转换为对应的id
        input_ids = tokenizer.convert_tokens_to_ids(input_tokens)
        label_ids = tokenizer.convert_tokens_to_ids(label_tokens)        # 确保input_ids和label_ids的长度一致
        max_length = max(len(input_ids), len(label_ids))
        input_ids.extend([0] * (max_length - len(input_ids)))
        label_ids.extend([0] * (max_length - len(label_ids)))        # 将input_ids和label_ids转换为tensor
        input_ids = torch.tensor(input_ids).unsqueeze(0).to(device)  # 增加batch维度
        label_ids = torch.tensor(label_ids).unsqueeze(0).to(device)  # 增加batch维度        return input_ids, label_ids

使用方式

1.裁剪数据集

修改lines_to_read = 1000

选择你想要的数据集大小,这里采用了1000条对联

原始数据集有70万条对联,根据需求还有电脑性能选择

根据自己的需要选择

2.用couplet数据集训练模型

在终端中输入命令 python bert.py,训练模型并监控损失变化。训练完成后会生成损失图像,并将模型保存在 model 文件夹中。

最终出来loss损失图像

模型存储在model文件夹中

3.将模型转换为ONNX格式

使用命令 python app.py 将存储的模型转换为ONNX格式,以便在前端调用。

4.打开index.html就可以在前端使用此自动对对联系统了。

在输入框中输入上联。

感觉不错,点击我,立即使用

http://www.yayakq.cn/news/201329/

相关文章:

  • 柳州最好的网站推广公司广告平台网站有哪些
  • 连锁销售网站制作百度seo还有前景吗
  • 受欢迎的南昌网站建设asp网站开发招聘
  • 山西大同网站建设免费的创建个人网站
  • 网站建设报价单 下载网站推广排名外包
  • 企业网站在百度搜索不到软件推广app
  • DW做旅游网站毕业设计模板网站建设与网站优化销售
  • 江门网站程序开发制作哪个网站是专门做男人衣服的
  • 网站设计策划dedecms网站源码
  • 杭州网站建设公司 4000262263做神马网站
  • 做卡盟网站赚钱吗wordpress 被搜索引擎
  • 温州瑞安网站建设平台重庆网站有哪些
  • 电子商城网站建设与维护营销推广的平台
  • 泉州做企业网站wordpress全图水印
  • 郑州做网站建设公司哪家好空间网站模板
  • 简述网站开发的三层架构分享惠网站怎么做
  • 万户网站协作管理系统疯狂大叔 wordpress
  • 免费网站后台管理系统html推广普通话作文500字
  • wordpress多站点模式插件重庆市建设厅官方网站
  • 网站建设有哪些技术沈阳企业网站设计制作
  • 做神马网站优化快梅江区建设局网站
  • 网站建设相关参考资料国内专业的seo机构
  • 白云品牌型网站建设无锡微信网站建设价格
  • 网站水军怎么做怎么做网页链接文章
  • 济南网站建设正规公司哪家好公司常用邮箱
  • 网站制作有前途吗seo关键词优化的技巧和方法
  • 别人做的网站需要提供些什么给我们wordpress 编辑器漏洞
  • 编辑网站用什么软件html代码特效
  • 云南网站建设找三好科技页面设计上边距在哪里找
  • 网站建设考试题wordpress移动主题now