当前位置: 首页 > news >正文

做网站上海龙岩建设局网站

做网站上海,龙岩建设局网站,做网站怎么去找客户,网站主机的类型一、数据类型 1、Text (文本数据类型) 2、Keyword(关键字数据类型) 3、Alias(别名类型) 4、Arrays (集合类型) 5、Boolean(布尔类型) 6、日期类型 7、Numeric (数…

一、数据类型

1、Text (文本数据类型)

2、Keyword(关键字数据类型)

3、Alias(别名类型)

4、Arrays (集合类型)

5、Boolean(布尔类型)

6、日期类型

7、Numeric (数值数据类型)

8、IP (数据类型)

9、Range (范围数据类型)

10、Binary (二进制类型)

11、Object (对象数据类型)

12、Dense vector (密集矢量数据类型)

13、Flattened (扁平化数据类型)

14、Geo-point (地理位置数据类型)

15、Join (链接数据类型)

16、Nested (嵌套数据类型)

17、Token count (令牌计数数据类型)

二、索引

1、正排索引和倒排索引的区别

正排索引:是文档(ID)到关键词的映射(从文档找关键词)

倒排索引:是关键词到文档(ID)的映射(从关键词到文档)

三、分词

1、分词:是将文本字符串拆分成独立的词汇和术语的过程。

四、分词器

1、Character Filters(字符过滤器):对原始文本进行预处理,对文本修改或者删除等。比如删除html标签、特定词替换等。

2、Tokenizer (分词器):对字符过滤器处理过的文本切分成一个个词条,形成词条流。切分规则可以是空格、标点符号等。

3、Token Filters(词汇过滤器):对切分后的词条进一步处理,大小写替换、启用停用词(没有意义的词)。词汇过滤器处理文本以适应索引和查询需求非常重要。

五、常见分词器

1、Standard Analyzer(分词依据:空格、标点符号)(特点:小写化处理,过滤符号)

2、Whitespace Analyzer (分词依据:空格)(特点:不进行小写处理、保留所有字符)

3、Keyword Analyzer (分词依据:无)(特点:将这个输入作为一个词条)

4、Simple Analyzer(分词依据:非字母(符号、数字))(特点:小写化处理、过滤符号、支持中文拼音分词)

5、Stop Analyzer (分词依据:空格)(特点:小写化处理,过滤停用词)

6、IK Analyzer(分词依据:词典)(特点:中文分词)

7、Edge Ngram Analyzer(分词依据:n-gram)(特点:按指定步长进行分词)

8、Pattern Analyzer (分词依据:正则匹配字符)(特点:灵活)

9、Custom Analyzer (分词依据:自定义)(特点:灵活)

http://www.yayakq.cn/news/234215/

相关文章:

  • 网站职业培训学校诸城做网站公司
  • 哪些大型网站用python做的商标制作logo在线制作
  • 360免费自助建站网站开发工作简历
  • Asp网站开发入门100个简单的手工小玩具
  • 广东网站备案要求网站页面架构图
  • 禅城建网站做短视频网站需要审批
  • 广东企业网站建设推荐阿里云备案网站建设方案书
  • 静态网站更新文章麻烦免费网站建设模板
  • 0基础网站开发网红营销的策略
  • 更合高明网站建设什么the wordpress
  • 外星人做的网站网站申请页面
  • 做网站用什么服务器好怎么修改网站的关键词
  • 怎么做网站的广告成都网站开发培训机构
  • 企业营销类专业网站福永小学网站建设
  • 网站设计一个版块旅行社网站建设方案
  • 建设销售型网站网站策划与设计(
  • 做网站怎样做才有百度快照网站建设费属于宣传费吗
  • 口碑好的网站建设多少钱评论网站建设
  • dedecms做的网站手机上看图片变形seo具体怎么优化
  • 网站策划专有技术泰安房产信息网
  • 做地铁系统集成的公司网站盐城网站建设价位
  • 婚恋网站建设技巧开发公司移交物业清单
  • 那个网站做的好蔡甸做网站
  • 工作箴言上海网站建设乐云seo
  • 一般网站用什么软件做网站百度不到验证码怎么办
  • 遂宁网站设计科技类网站怎么做
  • 网站建设流程 文档诚信快捷小企业网站建设
  • 漳州市城乡住房建设局网站南昌网站建设推广
  • wordpress4.2.19 漏洞合肥正规的seo公司
  • 网站备案的要求是什么情况流程图制作网页