当前位置: 首页 > news >正文

深圳市网站建设上海建筑设计公司平台

深圳市网站建设,上海建筑设计公司平台,外包加工项目,传奇页游平台响应参数讲解: key (字符串)由 categorization_analyzer 提取的标记组成,这些标记是类别中所有输入字段值的共同部分。 doc_count (整数)与类别匹配的文档数量。 max_matching_length (整数)从…

 响应参数讲解:

key (字符串)由 categorization_analyzer 提取的标记组成,这些标记是类别中所有输入字段值的共同部分。 doc_count (整数)与类别匹配的文档数量。 max_matching_length (整数)从较短消息中生成的类别也可能与从较长消息中生成的类别匹配。 max_matching_length 表示应被视为属于该类别的消息的最大长度。在搜索属于该类别的消息时,任何长度超过 max_matching_length 的消息都应被排除。使用此字段可以防止对短消息类别的搜索匹配到更长的消息。

regex (字符串)一个正则表达式,它将匹配类别中包含的所有输入字段值。在类别中包含的值的顺序不同时, regex 可能不会包含 key 中的每个术语。然而,在简单情况下, regex 将是按顺序连接的术语组成的正则表达式,允许在它们之间有任意部分。不建议将 regex 作为搜索原始被分类文档的主要机制,因为正则表达式搜索非常慢。相反,应该使用 key 字段中的术语来搜索匹配的文档,因为术语搜索可以利用倒排索引,因此速度要快得多。然而,在某些情况下,使用 regex 字段来测试未被索引的少量消息是否属于该类别,或者确认 key 中的术语在所有匹配文档中按正确顺序出现,可能是有用的。

总结:

重新分析大型结果集将需要大量的时间和内存。应将此聚合与异步搜索(Async search)结合使用。此外,你还可以考虑将该聚合作为采样器(sampler)或多样化采样器(diversified sampler)聚合的子聚合使用。这通常可以提高速度和内存使用效率。

POST log-messages/_search

{

  "aggs": {

    "categories": {

      "categorize_text": {

        "field": "message"

      }

    }

  }

}

输出

{

  "aggregations": {

    "categories": {

      "buckets": [

        {

          "doc_count": 3,

          "key": "Node shutting down",

          "regex": ".*?Node.+?shutting.+?down.*?",

          "max_matching_length": 49

        },

        {

          "doc_count": 1,

          "key": "Node starting up",

          "regex": ".*?Node.+?starting.+?up.*?",

          "max_matching_length": 47

        }

      ]

    }

  }

}

使用 categorization_analyzer 的示例配置:

{

  "aggs": {

    "categories": {

      "categorize_text": {

        "field": "message",

        "categorization_analyzer": {

          "char_filter": ["html_strip"],

          "tokenizer": "ml_standard",

          "filter": ["lowercase", "stop"]

        }

      }

    }

  }

}

使用   categorization_filters   的示例配置:

{

  "aggs": {

    "categories": {

      "categorize_text": {

        "field": "message",

        "categorization_filters": [

          "\\w+\\_\\d{3}", // 过滤掉类似 "foo_123" 的模式

          "ERROR:.*" // 过滤掉以 "ERROR:" 开头的日志

        ]

      }

    }

  }

}

 

http://www.yayakq.cn/news/833316/

相关文章:

  • 鞍山市信息网站谁能给我一个网址
  • 张家港市做网站的公司阿里买域名 电脑做网站
  • 站群网站推广工具费用网店代运营服务
  • 太原模板网站建站怎么制作网站程序
  • 四川网站建设电话咨询搭建企业网站公司
  • 做网站下导航字号为多大百度查重免费入口
  • 吴中快速建设网站价格汕头市住监局官网
  • 做收集信息的网站苍溪建设局网站
  • 蓝色风格网站模板上海高端品牌网站建设
  • 智慧团建官方网站登录广西网站建设哪家有
  • 织梦网站识别浙江省建设监理协会官方网站
  • 小语种建站找装修公司去哪个网站
  • 成都营销型网站制作wordpress会员到期
  • 湛江做网站seoflash做网站导航
  • 眼科医院网站开发宁波城乡住房建设局网站
  • 网站建设通知网图搜索识别
  • 免费怎样搭建网站五金配件店 东莞网站建设
  • 抚顺网站建设公司网站建设方案策划
  • 我的网站怎么转网页呢做视频采集网站违法吗
  • 怎么判断网站被k江门关键词优化价格
  • 做数学ppt工具的网站wordpress输入密码访问
  • 惠州网站建设惠州织梦网站装修公司源码
  • 网站打开速度很慢developer官网下载
  • 超值高端网站设计免费一卡二卡三
  • 网站开发内容怎么写想招人去哪个平台免费
  • 徐州优化网站建设移动端和pc端的意思
  • 床上做受网站永久免费建站空间
  • 如何用dede做带下单的网站深圳网站商城定制设计
  • 设计专业新手网站如何用dw做旅游网站目录
  • wordpress网站费用手机网站的优缺点