当前位置: 首页 > news >正文

了解互联网 网站百度怎么精准搜索

了解互联网 网站,百度怎么精准搜索,工商注册图片,互联网网站开发html5在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。 Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词&a…

在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。

  • Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词,中文语境中一个词条是分词后的一个词组。

    此处涉及到分词器,分词器的作用是将一段文字分解为若干个词组,不同的分词器使用的分词算法不同,得到的分词结果也不同。

  • Term Dictionary(词典):词典是词条的集合,顾名思义,词典中维护的是Term。词典一般是由文本集合中出现过的所有词条所组成的集合。

  • Term Index(词条索引):由于词典中维护着文本中所有的词条,为了在其中更快的找到某个词条,我们为词条建立索引。通过压缩算法,词条索引的大小只有所有词条的几十分之一,因此词条索引可以存储在内存中,因此可以提供更快的查找速度。

  • Posting List(倒排表):倒排表记录的是词条出现在哪些文档里,以及出现的位置和频率等信息。倒排表中的每条记录称为一个倒排项(posting)。

将以上概念类比到词典中,Term相当于词典中的词语,Term Dictionary相当于词典本身,Term Index相当于词典的目录。

举个栗子,假设现在我们输入系统多段文本,经过分词器分词后得到以下词条:

  • elastic
  • flink
  • hadoop
  • kafka
  • spark

ES倒排索引机制

我们使用ES进行全文搜索时,如图所示,系统首先会通过Term Index找到该Term在Term Dictionary中的位置,再通过倒排索引结构找到对应的Posting,从而定位到该词组在文本中的位置,完成一次搜索。

 

http://www.yayakq.cn/news/203518/

相关文章:

  • 广州网站百度排名推广许昌市网站建设找汉狮
  • 企业网站建设套餐网站建设分类方案
  • wordpress主题建站微信小程序论坛
  • 做外贸网站案例美食推荐网站模板
  • 海外设计网站建设下载京东商城网上购物
  • 免费做长图的网站网站的策划和建设
  • 学做网站论坛vip账户装修案例app哪个最好
  • 手机网站免费制作平台有哪些合作客户北京网站建设
  • 成都网站建设 哪家比较好苏州 手机网站
  • thinkphp旅游网站源码广州冼村姓什么
  • 咸阳网站开发公司地址用户注册
  • 代做企业网站备案国内简约网站设计
  • wordpress建站苏州wordpress调取缩略图
  • 一般网站有哪些模块html网页设计实验心得
  • 全球建筑网站安徽省建筑工程信息平台
  • 网站平台搭建和维护需要什么杭州房产网官方网站
  • 四川同风源建设工程有限公司网站wordpress 做大型网站
  • 购物网站建设安卓手机网站开发
  • 包头网站开发蚌埠网站建设专业的公司4000-262-
  • 怎样建立商贸网站深圳做外贸的大公司有哪些
  • 桥头仿做网站什么网站做简历好
  • 网站建设视频百度网盘如何自己建设电商网站
  • 网站优化如何做pc指数视频类网站怎么做
  • 网站做外链医院风格 wordpress
  • 网站开发需要哪些语言运维网站建设
  • 邯郸做网站推广的公司织梦网站文章发布模板下载
  • 网站空间文件夹网站域名使用代理
  • WordPress主题开源版宁波正规seo推广公司
  • php网站案例wordpress 内容编辑器
  • 给网站做图网站花瓣飘落的效果怎么做