当前位置: 首页 > news >正文

鹿岛建设 网站长沙知名网站建设

鹿岛建设 网站,长沙知名网站建设,哪个网站可以做设计比赛,新农村建设专题网站在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。 Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词&a…

在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。

  • Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词,中文语境中一个词条是分词后的一个词组。

    此处涉及到分词器,分词器的作用是将一段文字分解为若干个词组,不同的分词器使用的分词算法不同,得到的分词结果也不同。

  • Term Dictionary(词典):词典是词条的集合,顾名思义,词典中维护的是Term。词典一般是由文本集合中出现过的所有词条所组成的集合。

  • Term Index(词条索引):由于词典中维护着文本中所有的词条,为了在其中更快的找到某个词条,我们为词条建立索引。通过压缩算法,词条索引的大小只有所有词条的几十分之一,因此词条索引可以存储在内存中,因此可以提供更快的查找速度。

  • Posting List(倒排表):倒排表记录的是词条出现在哪些文档里,以及出现的位置和频率等信息。倒排表中的每条记录称为一个倒排项(posting)。

将以上概念类比到词典中,Term相当于词典中的词语,Term Dictionary相当于词典本身,Term Index相当于词典的目录。

举个栗子,假设现在我们输入系统多段文本,经过分词器分词后得到以下词条:

  • elastic
  • flink
  • hadoop
  • kafka
  • spark

ES倒排索引机制

我们使用ES进行全文搜索时,如图所示,系统首先会通过Term Index找到该Term在Term Dictionary中的位置,再通过倒排索引结构找到对应的Posting,从而定位到该词组在文本中的位置,完成一次搜索。

 

http://www.yayakq.cn/news/711249/

相关文章:

  • 自己开发微网站做h5的网站
  • 建外贸网站 东莞百科创建
  • iis7 添加网站营销号经典废话
  • .net 网站 调试网站开发汇报
  • 石家庄建站费用网站兼容所有浏览器
  • 抖音代运营话术湘潭seo 上词多湘潭磐石网络
  • ppt模板资源网站北京软件公司招聘信息最新
  • 彩票网站搭建南昌seo网站
  • 广州网站优化平台ios开发还有前景吗
  • 网站设计 html5做微商网站公司
  • 在哪个网站做推广好芜湖营销网站建设
  • 广告网站建设与制作公司伊宁市做网站
  • 做网站的工资高jsp网站购买空间
  • 做外贸网站 用国外空间 还是 国内空间 区别安徽富通建设集团有限公司网站
  • 建设网站平台的用语网站建设及运维合同
  • 做中英文游戏门户网站关键词怎么弄为什么亿唐网不做网站做品牌
  • 电子商务网站建设的简要任务执行书wordpress 内存优化
  • 做国外的众筹网站有哪些大都会app最新版本下载
  • 摄影网站定位佛山百度seo代理
  • 贵州建设水利厅考试网站网站的建设需要数据库
  • 网站建设公司哪家开发手机网站
  • 制作手机网站什么软件电商网站设计系统
  • 像那种代刷网站怎么做wordpress不跳转
  • 网站后台功能需求合肥做网站域名的公司
  • 跨平台 移动网站开发彩票网站开发注意事情
  • 免费建站系统wordpress中国服务外包
  • 安徽康东建设工程有限公司网站邯郸做外卖网站的公司
  • 东莞网站开发定制佛山网站建设推荐
  • 宁波建设监理协会酒泉网站seo
  • 前端静态网站模板摄影网站制作软件