ES中 minimum_should_match 的用法和误区

这篇具有很好参考价值的文章主要介绍了ES中 minimum_should_match 的用法和误区。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

背景

写这篇文章是因为有个同学在群里发了这么一张截图,图中讲的两点关于``的描述,我看了一眼,两个都是错的。
ES中 minimum_should_match 的用法和误区

目前互联网上的文章质量参差不齐,这也算是为了提高网络博客的质量进一己之力吧。
ES中 minimum_should_match 的用法和误区

上述截图中的两个认知误区

1、不能简单的说 7.0 版本之后 默认值是 0 或者 1

minimum_should_match是ES组合查询中的一个常用参数,参数指定should子句返回的文档必须匹配的子句的数量或百分比。注意这里可以输具体的数量,也可以是百分数指定。并且满足以下两个条件:

  • 如果bool查询包含至少一个should子句,而没有must或 filter子句,则默认值为1。即此时minimum_should_match如果没有显示的配置,should子句中的条件必须至少满足一个。
  • 如果bool查询包包含mustfilter子句,则minimum_should_match默认值为0,即:此时minimum_should_match如果没有显示的配置,此时should子句中可以不满足任何条件。

2、minimum_should_match并不是非用不可

minimum_should_match可以控制查询精度,在should和must联合查询查询时必须使用”,这句话的描述也存在问题。下面通过一个习题案例,来证明:

Task:
假设有movie_data索引包含如下文档:

{
  "minutes": 136,
  "movie_id": "1893",
  "title": "Star Wars: Episode I - The Phantom Menace",
  "tags": [
    "prophecy",
    "senate",
    "queen",
    "taskmaster",
    "galaxy",
    "apprentice",
    "taxes",
    "space opera"
  ],
  "revenue": 924317558,
  "release_date": "1999-05-19T06:00:00.000Z",
  "budget": 115000000,
  "avg_score": 6.3
}

movie_data索引上写一个单独的搜索,满足以下要求:

  • title 字段包含memy
  • tags字段带有romantic comedy标签的文档得分权重高于标签中不包含romantic comedy标签的文档。

答案

GET movie_data/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "title": "my me"
          }
        }
      ],
      "should": [
        {
          "match": {
            "tags.keyword": {
              "query": "romantic comedy",
              "boost": 10
            }
          }
        }
      ]
    }
  }
}

分析

这里只针对should子句展开分析,也就是题目的第二个要求。此题答案中同事包含了mustshould子句。

题目中只是说tags字段如果带有romantic comedy标签,那么它的得分权重更高。但是并没有要求带有romantic comedy标签是个必要条件。换句话说,就是带有romantic comedy标签,那么提高评分权重,如果不带,那么什么也不做。

答案中并未显示的配置minimum_should_match参数,所以此时minimum_should_match的默认值是0。即should子句中的条件可以完全不满足。也就是说should子句不会对最终结果的文档数产生影响。那么当前子句的语义则为:带有romantic comedy标签的文档,权重提升10倍,如果不带,也没有关系。

推荐阅读:文章来源地址https://www.toymoban.com/news/detail-406288.html

  • ES中的bool query深层次解读

到了这里,关于ES中 minimum_should_match 的用法和误区的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ES中同时使用should和must导致只有must生效解决方案

    背景:es嵌套查询,条件a等于某一个值且条件b等于某两个值甚至更多。 第一步:单独条件b采用 should 匹配多个值,可以查到预期的结果,代码如下: 第二步:单独条件a采用must匹配单个值,也可以查到预期的结果,代码如下: 第三步:合并起来查询,a和b条件同时启用,代

    2024年02月15日
    浏览(30)
  • 【ES】es查询term、match、match_phrase、mast_not、mast...

    keyword:不分词 非keyword:分词 对属性名.keyword,就是全值匹配。如果查询的属性是text,就会匹配分词。 term:查询的入参,不会分词。 terms:查询的入参,不会分词。 match:分词匹配 match_phrase:短语匹配,一个slop属性,可以使短语中的词,调换顺序 match_phrase_prefix:分词前缀

    2024年02月22日
    浏览(42)
  • ES-match_all、match和match_phrase的区别

    match_all 查询是一种简单的查询,匹配索引中的所有文档,无论文档中的字段内容如何。返回索引中的全部文档。eg: match 查询使用分析器来分词和处理查询字符串, match 很智能,会根据查询字段类型,采用不同的查询方式,比如: 查询的字段是日期或者数值类型的话,它会

    2024年02月05日
    浏览(40)
  • ElasticSearch中查询语句用法(match、match_phrase、multi_match、query_string)

    略 1.1 不同字段权重         如果需要为不同字段设置不同权重,可以考虑使用 bool 查询的 should 子句来组合多个 match 查询,并为每个 match 查询设置不同的权重。         上面的查询将在 product_name 字段和 description 字段中搜索包含 \\\"apple\\\" 的文档,并为 product_name 字段设

    2024年02月10日
    浏览(41)
  • es笔记三之term,match,match_phrase 等查询方法介绍

    本文首发于公众号:Hunter后端 原文链接:es笔记三之term,match,match_phrase 等查询方法介绍 首先介绍一下在 es 里有两种存储字符串的字段类型,一个是 keyword,一个是 text。 keyword 在存储数据的时候是作为一个整体存储的,不会对其进行分词处理 text 存储数据的时候会对字符串

    2024年02月05日
    浏览(51)
  • es中的match、term、text、keyword、bool

    总结一下es中的match、term、text、keyword、bool等。比如我想搜索一辆“红色奥迪车”: match:在匹配时会对所查找的进行分词,然后按分词匹配查找,用于模糊查询。结果会将包含“红色”或“奥迪”的车都找出来。 term:对进行查找,用于精确查找。只有名

    2024年02月11日
    浏览(39)
  • ElasticSearch系列 - SpringBoot整合ES之全文搜索匹配查询 match

    官方文档地址:https://www.elastic.co/guide/en/elasticsearch/reference/index.html 权威指南:https://www.elastic.co/guide/cn/elasticsearch/guide/current/structured-search.html 1. 数据准备 官方测试数据下载地址:https://download.elastic.co/demos/kibana/gettingstarted/accounts.zip ,数据量很大,我们自己构造数据吧。 2. m

    2023年04月08日
    浏览(51)
  • ES默认不按照下划线分词 ( multi_match)

    去ES官方文档页面 ES默认不按照下划线分词

    2024年02月12日
    浏览(32)
  • ElasticSearch系列 - SpringBoot整合ES:短语匹配查询 match_phrase

    1. ElasticSearch match_phrase查询是什么?它与match查询有什么区别? match_phrase查询是一种用于匹配短语的查询方式,可以用于精确匹配多个单词组成的短语。它会将查询字符串分解成单词,然后按照顺序匹配文档中的单词,只有当文档中的单词顺序与查询字符串中的单词顺序完全

    2024年02月12日
    浏览(50)
  • ElasticSearch系列 - SpringBoot整合ES:多字段查询 multi_match

    1. 什么是 ElasticSearch 的 multi_match 查询? 有时用户需要在多个字段中查询,除了使用布尔查询封装多个match查询之外,可替代的方案是使用multi_match。可以在multi_match的query子句中组织数据匹配规则,并在fields子句中指定需要搜索的字段列表。 以下是一个示例multi-match查询

    2023年04月21日
    浏览(64)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包