Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合-Toy模板网

这篇具有很好参考价值的文章主要介绍了Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

⛄引言

本文参考黑马分布式Elastic search

Elasticsearch是一款非常强大的开源搜索引擎，具备非常多强大功能，可以帮助我们从海量数据中快速找到需要的内容

本篇文章将讲解 Elastic Search 如何实现数据聚合，以及在项目实战中如何通过数据聚合实现业务需求并完成功能。

一、数据聚合

⛅简介

以下为官方解释：

聚合可以进行各种组合以构建复杂的数据汇总。

可以看作是在一组文档上建立分析信息的工作单元，统计一些文档集。聚合可以将一些独立的功能单元可以被混合在一起来满足你的需求，是一种单独的语法。
kibana的可视化看板就是非常经典的聚合功能的体现。

简单的来说：

聚合可以让我们极其方便的实现对数据的统计、分析、运算。例如：

什么品牌的手机最受欢迎？
这些手机的平均价格、最高价格、最低价格？
这些手机每月的销售情况如何？

实现这些统计功能的比数据库的sql要方便的多，而且查询速度非常快，可以实现实时搜索效果。

聚合就是类似于垃圾分类，干湿分离，每个桶中装不同的数据。

⚡聚合的分类

聚合主要分为三大类：

桶（Bucket） 聚合：用来对文档做分组
- TermAggregation：按照文档字段值分组，例如按照品牌值分组、按照国家分组
- Date Histogram：按照日期阶梯分组，例如一周为一组，或者一月为一组
度量（Metric） 聚合：用以计算一些值，比如：最大值、最小值、平均值等
- Avg：求平均值
- Max：求最大值
- Min：求最小值
- Stats：同时求max、min、avg、sum等
管道（pipeline） 聚合：其它聚合的结果为基础做聚合

注意： 参加聚合的字段必须是keyword、日期、数值、布尔类型

二、DSL实现数据聚合

例如：要统计所有数据中的酒店品牌有几种，其实就是按照品牌对数据分组。此时可以根据酒店品牌的名称做聚合，也就是Bucket聚合。

⏰Bucket聚合

语法如下：

GET /hotel/_search
{
  "size": 0,  // 设置size为0，结果中不包含文档，只包含聚合结果
  "aggs": { // 定义聚合
    "brandAgg": { //给聚合起个名字
      "terms": { // 聚合的类型，按照品牌值聚合，所以选择term
        "field": "brand", // 参与聚合的字段
        "size": 20 // 希望获取的聚合结果数量
      }
    }
  }
}

结果如图：

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

聚合结果进行数据排序

默认情况下，Bucket聚合会统计Bucket内的文档数量，记为 count，并且按照 _count降序排序。

我们可以指定 order属性，自定义聚合的排序方式：

GET /hotel/_search
{
  "size": 0, 
  "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand",
        "order": {
          "_count": "asc" // 按照_count升序排列
        },
        "size": 20
      }
    }
  }
}

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

限定聚合范围

默认情况下，Bucket聚合是对索引库的所有文档做聚合，但真实场景下，用户会输入搜索条件，因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。

我们可以限定要聚合的文档范围，只要添加query条件即可：

GET /hotel/_search
{
  "query": {
    "range": {
      "price": {
        "lte": 200 // 只对200元以下的文档聚合
      }
    }
  }, 
  "size": 0, 
  "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand",
        "size": 20
      }
    }
  }
}

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

⚡Metric聚合

我们对酒店按照品牌分组，形成了一个个桶。现在我们需要对桶内的酒店做运算，获取每个品牌的用户评分的min、max、avg等值。

这就要用到Metric聚合了，例如stat聚合：就可以获取min、max、avg等结果。

语法如下：

GET /hotel/_search
{
  "size": 0, 
  "aggs": {
    "brandAgg": { 
      "terms": { 
        "field": "brand", 
        "size": 20
      },
      "aggs": { // 是brands聚合的子聚合，也就是分组后对每组分别计算
        "score_stats": { // 聚合名称
          "stats": { // 聚合类型，这里stats可以计算min、max、avg等
            "field": "score" // 聚合字段，这里是score
          }
        }
      }
    }
  }
}

这次的score_stats聚合是在 brandAgg 的聚合内部嵌套的子聚合。因为我们需要在每个桶分别计算。

另外，我们还可以给聚合结果做个排序，例如按照每个桶的酒店平均分做排序：

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

聚合小结

aggs代表聚合，与query同级，此时query的作用是

限定聚合的的文档范围

聚合必须的三要素：

聚合名称
聚合类型
聚合字段

聚合可配置属性有：

size：指定聚合结果数量
order：指定聚合结果排序方式
field：指定聚合字段

三、RestAPI实现数据聚合

API语法

聚合条件与query条件同级别，因此需要使用request.source()来指定聚合条件。

聚合条件的语法：

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

聚合的结果也与查询结果不同，API也比较特殊。不过同样是JSON逐层解析：

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

⌚业务需求

需求：在搜索页面的品牌、城市等信息不应该是在页面写死，而是通过聚合索引库中的酒店数据得来的：

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

需求分析：

目前，页面的城市列表、星级列表、品牌列表都是写死的，并不会随着搜索结果的变化而变化。但是用户搜索条件改变时，搜索结果会跟着变化。

例如：用户搜索“天安门”，那搜索的酒店肯定是在虹桥附近，因此，城市只能是上海，此时城市列表中就不应该显示其他城市信息了。

也就是说，搜索结果中包含哪些城市，页面就应该列出哪些城市；搜索结果中包含哪些品牌，页面就应该列出哪些品牌。

如何得知搜索结果中包含哪些品牌？如何得知搜索结果中包含哪些城市？

使用聚合功能，利用Bucket聚合，对搜索结果中的文档基于品牌分组、基于城市分组，就能得知包含哪些品牌、哪些城市了。

因为是对搜索结果聚合，因此聚合是限定范围的聚合，也就是说聚合的限定条件跟搜索文档的条件一致。

查看浏览器可以发现，前端其实已经发出了这样的一个请求：

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

因此，返回的类型应该是以下

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

结果是一个Map结构：

key是字符串，城市、星级、品牌、价格
value是集合，例如多个城市的名称

⏰业务代码实现

在HotelController中添加一个方法，遵循下面的要求：

请求方式：POST
请求路径：/hotel/filters
请求参数：RequestParams，与搜索文档的参数一致
返回值类型：Map<String, List<String>>

代码：

    @PostMapping("filters")
    public Map<String, List<String>> getFilters(@RequestBody RequestParams params){
        return hotelService.getFilters(params);
    }

这里调用了IHotelService中的getFilters方法，尚未实现。

在IHotelService中定义新方法：

Map<String, List<String>> filters(RequestParams params);

在HotelService中实现该方法：

@Override
public Map<String, List<String>> filters(RequestParams params) {
    try {
        // 1.准备Request
        SearchRequest request = new SearchRequest("hotel");
        // 2.准备DSL
        // 2.1.query
        buildBasicQuery(params, request);
        // 2.2.设置size
        request.source().size(0);
        // 2.3.聚合
        buildAggregation(request);
        // 3.发出请求
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        // 4.解析结果
        Map<String, List<String>> result = new HashMap<>();
        Aggregations aggregations = response.getAggregations();
        // 4.1.根据品牌名称，获取品牌结果
        List<String> brandList = getAggByName(aggregations, "brandAgg");
        result.put("品牌", brandList);
        // 4.2.根据品牌名称，获取品牌结果
        List<String> cityList = getAggByName(aggregations, "cityAgg");
        result.put("城市", cityList);
        // 4.3.根据品牌名称，获取品牌结果
        List<String> starList = getAggByName(aggregations, "starAgg");
        result.put("星级", starList);

        return result;
    } catch (IOException e) {
        throw new RuntimeException(e);
    }
}

private void buildAggregation(SearchRequest request) {
    request.source().aggregation(AggregationBuilders
                                 .terms("brandAgg")
                                 .field("brand")
                                 .size(100)
                                );
    request.source().aggregation(AggregationBuilders
                                 .terms("cityAgg")
                                 .field("city")
                                 .size(100)
                                );
    request.source().aggregation(AggregationBuilders
                                 .terms("starAgg")
                                 .field("starName")
                                 .size(100)
                                );
}

private List<String> getAggByName(Aggregations aggregations, String aggName) {
    // 4.1.根据聚合名称获取聚合结果
    Terms brandTerms = aggregations.get(aggName);
    // 4.2.获取buckets
    List<? extends Terms.Bucket> buckets = brandTerms.getBuckets();
    // 4.3.遍历
    List<String> brandList = new ArrayList<>();
    for (Terms.Bucket bucket : buckets) {
        // 4.4.获取key
        String key = bucket.getKeyAsString();
        brandList.add(key);
    }
    return brandList;
}

✅效果图

Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合,从零到一搞定 ElasticSearch,spring boot,分布式,搜索引擎,elasticsearch,微服务,原力计划

⛵小结

以上就是【Bug 终结者】对 Spring Boot 整合分布式搜索引擎 Elastic Search 实现搜索、分页与结果过滤 的简单介绍，ES搜索引擎无疑是最优秀的分布式搜索引擎，使用它，可大大提高项目的灵活、高效性！ 技术改变世界！！！

如果这篇【文章】有帮助到你，希望可以给【Bug 终结者】点个赞👍，创作不易，如果有对【后端技术】、【前端领域】感兴趣的小可爱，也欢迎关注❤️❤️❤️ 【Bug 终结者】❤️❤️❤️，我将会给你带来巨大的【收获与惊喜】💝💝💝！文章来源地址https://www.toymoban.com/news/detail-677515.html

到了这里，关于Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！