当前位置: 首页 > news >正文

宁波网站优化公司推荐wordpress条件搜索

宁波网站优化公司推荐,wordpress条件搜索,江苏嘉文建设发展有限公司网站,铁岭做网站哪家好在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。 Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词&a…

在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。

  • Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词,中文语境中一个词条是分词后的一个词组。

    此处涉及到分词器,分词器的作用是将一段文字分解为若干个词组,不同的分词器使用的分词算法不同,得到的分词结果也不同。

  • Term Dictionary(词典):词典是词条的集合,顾名思义,词典中维护的是Term。词典一般是由文本集合中出现过的所有词条所组成的集合。

  • Term Index(词条索引):由于词典中维护着文本中所有的词条,为了在其中更快的找到某个词条,我们为词条建立索引。通过压缩算法,词条索引的大小只有所有词条的几十分之一,因此词条索引可以存储在内存中,因此可以提供更快的查找速度。

  • Posting List(倒排表):倒排表记录的是词条出现在哪些文档里,以及出现的位置和频率等信息。倒排表中的每条记录称为一个倒排项(posting)。

将以上概念类比到词典中,Term相当于词典中的词语,Term Dictionary相当于词典本身,Term Index相当于词典的目录。

举个栗子,假设现在我们输入系统多段文本,经过分词器分词后得到以下词条:

  • elastic
  • flink
  • hadoop
  • kafka
  • spark

ES倒排索引机制

我们使用ES进行全文搜索时,如图所示,系统首先会通过Term Index找到该Term在Term Dictionary中的位置,再通过倒排索引结构找到对应的Posting,从而定位到该词组在文本中的位置,完成一次搜索。

 

http://www.yayakq.cn/news/315154/

相关文章:

  • 专业广州网站设计杭州富阳区网站建设公司
  • 违法网站怎么做安全wordpress 购物网站
  • 合肥建设局网站官网wordpress架构分析
  • 湘潭网站建设优化技术网站规划包含哪些内容
  • j建设银行查数据的网站网站的设计与实现
  • 阿玛尼手表网站县门户网站建设整改
  • 子网站建设学院网站群建设的目标
  • 手机钓鱼网站制作网站建设目录
  • 修改WordPress网站微信app下载安装免费
  • 景区网站建设方案 费用自己买主机可以做网站吗
  • 孝感建设网站开发工具指的是什么
  • 基层建设是哪个网站的赣州是哪个省
  • 义乌外贸公司网站沛县建设局网站
  • 合肥城乡建设网站首页怎么通过所有的网站推广广告
  • 企业网站推广宣传方案搜狗网址大全
  • 网站菜单导航制作常见的网络推广方法
  • .net 门户网站wordpress页面修改密码
  • 网站开发招聘网络推广公司名字
  • 好的网站或网页推荐网站和虚拟服务器
  • jsp手机版网站开发建站都需要什么
  • 哪个建站系统好wordpress会员登陆
  • asp无刷新网站模板百度竞价是什么
  • 网站建设交流发言公众号开发实践 pdf
  • wordpress怎么修改网站标题网站服务器连接被重置
  • 网站建设参考文献网站上的链接怎么做
  • sns社交网站源码深圳建设网站的公司
  • 物联网工程就业前景南宁网站排名优化电话
  • 网站建设 后台给人做网站赚钱
  • 建设的网站如何让用户注册做网站时会遇到什么问题
  • 各大网站黑白几天网站APP注册做任务