ElasticSearch（四）深入搜索查询-Toy模板网

这篇具有很好参考价值的文章主要介绍了ElasticSearch（四）深入搜索查询。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、评分机制

算法

TF-IDF

是一种用于信息检索与数据挖掘的常用加权技术；

计算公式：

ElasticSearch（四）深入搜索查询,ElasticSearch,elasticsearch,大数据,搜索引擎

TF是词频；

IDF是逆向文本率：每个检索词在索引中出现的频率，频率越高，相关性越低；（指的是整个文档中的占比）十篇文章中都有结果和一篇文章中有结果，显然一篇文章有结果相关性更强；

字段长度归一值：字段越短，字段占比越高，相关度越高；

BM25 算法
主要针对词频的增加，评分增加逐渐趋于平缓的优化；

二、算分分析

GET /索引名称/_search

{

"explain":true,
"query":{
"match":{
"title"："java设计模式"

}

"size":10

}

三、Boosting

Boosting是控制相关度的一种手段；

参数boost的含义：
当boost > 1时，打分的权重相对性提升
当0 < boost <1时，打分的权重相对性降低
当boost <0时，贡献负分

返回匹配positive查询的文档并降低匹配negative查询的文档相似度分。

GET /test_score/_search

{
    "query":{
        "boosting":{
            "positive":{
                "term":{
                    "content":"elasticsearch"
                }
            },
            "negative":{
                "term":{
                    "content":"like"
                }
            },
            "negative_boost":0.2
        }
    }
}

"negative_boost":0.2

内容包含like的得分乘以0.2；

四、布尔查询

一个bool查询是一个或多个查询子句组合；

a、must：必须匹配，共享算分；

b、should：选择性匹配相当于或贡献算分；

c、must_not：必须不匹配，不贡献

d、filter：必须匹配，不贡献算分

Query和filter4两种不同的上线文：Query 相关性算分，filter不需要算分，可以利用Cache，性能更好；

复合查询语句的相关性评分是将子查询语句合并得到的结果；

GET /索引名/_search
{
    "query":{
        "bool":{
            "must":{
                "match":{
                    "remark":"java"
                }
            },
            "filter":{
                "term":{
                    "sex":"1"
                }
            },
            "must_not":{
                "range":{
                    "age":{
                        "gte":30
                    }
                }
            },
            "should":[
                {
                    "term":{
                        "address.keyword":{
                            "value":"安徽"
                        }
                    }
                },
                {
                    "term":{
                        "address.keyword":{
                            "value":"安徽合肥"
                        }
                    }
                }
            ],
            "minimum_should_match":1
        }
    }
}

使用bool查询控制算分

GET /索引名/_search

{
    "query":{
        "bool":{
            "should":[
                {
                    "match":{
                        "title":{
                            "query":"apple,ipad",
                            "boost":1
                        }
                    }
                },
                {
                    "match":{
                        "content":{
                            "query":"apple,ipad",
                            "boost":4
                        }
                    }
                }
            ]
        }
    }
}文章来源地址https://www.toymoban.com/news/detail-806969.html