当前位置: 首页 > news >正文

公司网站谁负责做潍坊市高新区建设局网站

公司网站谁负责做,潍坊市高新区建设局网站,0基础网站建设教程,h5网站建设包括什么正排索引 和 倒排索引 正排索引:通过id ,查询content 倒排索引:通过content,查询到符合的 ids eg: 正排索引就是通过《静夜思》,找到整片文章。 倒排索引通过“明月”,找到《静夜思》 《望…

正排索引 和 倒排索引

正排索引:通过id ,查询content

倒排索引:通过content,查询到符合的 ids

eg:

正排索引就是通过《静夜思》,找到整片文章。

倒排索引通过“明月”,找到《静夜思》 《望月怀古》《关山月》等

get 查询

索引的基本信息:

GET your_index/_mapping  //跟看mysql表字段差不多
GET your_index/_alias  //查看索引的别名
GET /_cat/health?v  //查看集群状态
GET _cat/indices // 查看所有index
GET _cat/shards/your_index  //查看指定索引的分片数,每个分片有主(p)副(r)分片

查询索引内容:

match_all


GET /you_index/_search
{"query":{"match_all": {}
}

bool 

bool查询是一个非常强大且常用的复合查询,它允许你组合多个查询条件。bool 查询的核心概念包括以下四种子句:

  1. must: 子句必须匹配文档。类似于 SQL 中的 AND 操作符。
  2. filter: 子句必须匹配文档,但不影响评分。也就是说,它只过滤文档,但不参与评分计算。
  3. should: 子句可以匹配文档。如果在一个 bool 查询中包含了多个 should 子句,则至少一个 should 子句必须匹配文档。类似于 SQL 中的 OR 操作符。
  4. must_not: 子句不能匹配文档。类似于 SQL 中的 NOT 操作符。

eg: 

GET you_index/_search
{"query": {"bool": {"must": [{"bool": {"should": [{"term": {"name": {"value": "林俊凯","boost": 1}}},{"term": {"zh_name": {"value": "林俊凯","boost": 1}}}]}},{"bool": {"should": [{"range": {"fans_num": {"gte": "800"}}},{"terms": {"tag": [1010,1013]}}]}}]}},"sort": {"_score": {"order": "desc"},"score": {"order": "desc"}}
}

range

    "range": {"fans_num": {"gte": 800,"lte":126334}}

gte:大于等于;lte小于等于

term 

 不分词,精准完全匹配查询

GET your_index_search/_search
{"query": {"term": {"name": {"value": "天空"}}}
}

terms

不分词,命中数组一个即可,不要求全部命中

GET your_index_search/_search
{"query": {"terms": {"tag": ["美食","购物"]}}
}

prefix

前缀匹配,不分词 ,精准匹配前半部分

GET your_index_search/_search
{"query": {"prefix": {"name_full": {"value": "林俊"}}}
}

林俊凯,林俊xxx都会命中

multi_match

会对query词进行分词

GET your_index_search/_search
{"query": {"bool": {"must": [{"multi_match": {"query": "北京景点","fields": ["name","name_full", "name_lower"],"analyzer":"ik","minimum_should_match":"3<80%"}}]}}
}

这里的 "minimum_should_match": "3<80%" 指定了如下规则:

  • 如果分词数量小于或等于 3,则必须匹配所有分词。

  • 如果分词数量大于 3,则至少匹配 80% 的分词。

这里的“analyzer”,是分词器,常见的有ik ik-smart  standard mla 

GET _analyze
{"analyzer":"mla","text":"北京景点"
}//结果为
{"tokens": [{"token": "北京","start_offset": 0,"end_offset": 2,"type": "CN_WORD","position": 0},{"token": "景点","start_offset": 2,"end_offset": 4,"type": "CN_WORD","position": 1}]
}

eg:“北京景点”分词为【北京,景点】,分词项为2,小于3,那么【北京】和【景点】需要在field中匹配到。multi_match 查询的目的是在多个字段中搜索查询词中的词语,并且匹配规则会跨字段应用,比如 【北京】在name匹配到,【景点】在name_lower配到到,即匹配成功。

multi_phrase

会对query词进行分词(有的人会认为不会分词,❌),match_phrase要求严格,不仅要求,要能够匹配到分词后的所有单词,且分词后的单词顺序也要和命中结果中的顺序保持一致。

GET your_index_search/_search
{"query": {"bool": {"must": [{"match_phrase": {"name": "北京"}}]}}
}

name = “北京”能找到,“北 京” 或者“京北” 就找不到

可以设置slop,最大间隔,默认是0

match

会分词,没有multi_phrase那么严格,match要求不高,只要匹配到分词后的任意一个单词,就算查到结果 。

为什么match能找到,term查询不到呢?

首先,要看创建索引的时候mapping ,字段的类型。如果是type是keyword,不允许分词。

其次,查看字段类型发现是text,term查询的字段类型只能是keyword

"keyword_full": {"type": "text","fields": {"keyword": {"type": "keyword"}}}, 

http://www.yayakq.cn/news/749356/

相关文章:

  • 手工艺品网站建设方案网站服务器租用技巧
  • 阜阳哪里做网站用tomcat做网站
  • 企业网站托管外包方案怎么入驻京东商家平台
  • 杂多县网站建设公司公司建设门户网站的总结
  • 怎么样让百度搜到自己的网站网页制作公司怎么做
  • 网站制作报价单模板wordpress文章变缩略图
  • 最权威的做网站设计公司价格自己网页制作的目标和受众
  • html静态网站开发北京建工集团有限公司官网
  • 前端网站大全wordpress 优化标题
  • 化妆品商城网站建设如何做网站产品经理
  • 怎么做网站上打字体如何用公司名称搜到公司网站
  • 商会网站模板响应式网站简单模板
  • 西乡专业做网站公司创意设计素描图片
  • 关于地产设计网站网络维护是什么专业
  • 网站改版新闻稿新人怎么做电商
  • 北海做网站做兼职的网站有哪些工作内容
  • 英文二手汽车网站建设广东建设工程信息服务平台
  • iis网站重定向设置成都建筑设计有限公司
  • 个人做网站外包价格如何算seo技术公司
  • 爱站工具时代创信网站建设
  • 青海 网站开发 图灵wordpress 取消注册邮件
  • 网站的交互性做淘客网站用备案吗
  • 官方网站建设需要做哪些东西嘉鱼网站建设优化
  • 电子科技公司网站建设方案wordpress 论坛末班
  • 想学网站建设方向的研究生好看的模板图片
  • 网站开发入门培训机构酷炫网站欣赏
  • 查看网站dns服务器wordpress怎么安装主题
  • 湖北工程建设总承包有限公司网站太和网站建设
  • 如何建设好网站湖南省建设厅官方网站
  • 太原电子商务网站的建设与服务傻瓜式网站简单界面