当前位置: 首页 > news >正文

文档怎么做网站链接石家庄建设

文档怎么做网站链接,石家庄建设,wordpress底下固定,app开发技术引言 本文是七月在线《NLP中的对话机器人》的视频笔记,主要介绍FAQ问答型聊天机器人的实现。 模型的评估 我们如何评估模型的好坏?由于我们的数据集没有提供测试数据,所以我们很难评估模型的好 坏。如果我们要做非常严谨的评估&#xff0c…

引言

本文是七月在线《NLP中的对话机器人》的视频笔记,主要介绍FAQ问答型聊天机器人的实现。

模型的评估

我们如何评估模型的好坏?由于我们的数据集没有提供测试数据,所以我们很难评估模型的好
坏。如果我们要做非常严谨的评估,最好是能够制作一个验证数据集,包括训练数据中不存在的
新问题,与该问题最相近的已知问题,以及问题的答案。

虽然我们实现的是FAQ问答机器人,但实际上解决的是搜索问题,比如给定问题查找最相似问题的答案。

MRR

评估指标可以采用Mean Reciprocal Rank(MRR), 这是一个推荐系统的评价指标,也就是正确答案在推荐答案中的排名的倒数平均。

MRR的原理如下:
MRR=1∣Q∣∑i=1∣Q∣1ranki\text{MRR} = \frac{1}{|Q|} \sum_{i=1}^{|Q|} \frac{1}{\text{rank}_i} MRR=Q1i=1Qranki1

假设给定一个问题,你知道它的正确答案是什么。模型会在整个数据集上进行搜索,它会给数据集中的每个问题打一个分数,我们就知道正确答案被模型排到哪个位置。
正确答案排名越高表示系统越好,MRR表示的是最佳答案排名的倒数。最佳答案排名是1到样本总数n,那么倒数是就是0到1之间的数值。然后对所有问题样本计算的该数值求平均,得到的还是0到1之间的数值。分数越接近1表示模型越好。

其代码实现如下:


def mean_reciprocal_rank(rs):"""Score is reciprocal of the rank of the first relevant itemFirst element is 'rank 1'.  Relevance is binary (nonzero is relevant).Example from http://en.wikipedia.org/wiki/Mean_reciprocal_rank>>> rs = [[0, 0, 1], [0, 1, 0], [1, 0, 0]]>>> mean_reciprocal_rank(rs)0.61111111111111105>>> rs = np.array([[0, 0, 0], [0, 1, 0], [1, 0, 0]])>>> mean_reciprocal_rank(rs)0.5>>> rs = [[0, 0, 0, 1], [1, 0, 0], [1, 0, 0]]>>> mean_reciprocal_rank(rs)0.75Args:rs: Iterator of relevance scores (list or numpy) in rank order(first element is the first item)Returns:Mean reciprocal rank"""rs = [np.asarray(r).nonzero()[0] for r in rs]return np.mean([1. / (r[0] + 1) if r.size else 0. for r in rs])

从注释中可知,rs = [[0, 0, 1], [0, 1, 0], [1, 0, 0]]表示正确答案的位置,比如第一个问题正确答案在位置3;第二个问题正确答案在位置2;第三个问题正确答案在位置1。

np.nonzero()返回非零元素的位置,可能有多个,因此返回的是数组。但这里实际上只有一个,nonzero()[0]得到它的位置。

rs = [[0, 0, 1], [0, 1, 0], [1, 0, 0]]
rs = [np.asarray(r).nonzero()[0] for r in rs]
rs
[array([2]), array([1]), array([0])]

这里表示我们只关注模型返回的前3个最相似问题,其中正确答案分别在位置3,位置2,和位置1。

np.mean([1. / (r[0] + 1) if r.size else 0. for r in rs])
0.611111111111111

如果某个结果中一个正确答案都没有,那么它的大小(size)就是0,得分就是0。否则得分为位置的倒数(索引才0开始,加1变成了位置)。

参考

  1. https://gist.github.com/bwhite/3726239
http://www.yayakq.cn/news/101933/

相关文章:

  • 北京科技网站开发自己怎么优化关键词
  • 网站上放的动画视频是怎么做的婚纱摄影网站排名
  • 企业可以做哪些网站有哪些有什么网站专门做美食的吗
  • 河南省南水北调建设管理局网站课程设计模板
  • 创建网站需要哪些要素手机网站快速建设
  • 公司网站修改方案做网站大约需要多少钱
  • dnf做汉堡怎么玩间网站河北师大科技楼网站建设
  • 网站建设 中企动力 东莞做网站怎么建站点
  • p2p网站建设报价2p排名软件开发的八个步骤
  • 松江网站关键词优化小程序平台商城
  • 公司网站需要备案么刚学做网站怎么划算
  • 自己做网站类型wordpress 能承受多大并发访问
  • 刷排名凡搜网站宝h5说 网站
  • 三端互通传奇发布网网站优化工作
  • 曾舜晞网站是哪个公司做的乐从做网站
  • 企业网站开发需要阿里云域名注册邮箱
  • 电子商务网站建设完整案例教程山东省建设工会网站
  • 携程旅游网官方网站 做攻略营销型网站建设细节
  • 免费网站制作教程网站建设与网络编辑综合实训课程指导手册
  • 本溪建网站网络销售每天做什么
  • 免费网站后台模版珠海企业集团网站建设
  • 邯郸开发网站有哪些禁止网站收录
  • 佛山建设网站公司吗网站建设对于企业发展的优势
  • 官方网站welcome怎么注册环球贸易网官网
  • 新网站怎样做优化电商行业
  • 做的网站百度上可以搜到吗环保公司网站模板
  • 温州 网站建设公司网站建设多少钱裙
  • 商务网站开发代码百度平台app下载
  • ftp给网站做备份万网的网站怎么建设
  • 免费企业查询网站iis 网站显示建设中