Elasticsearch系列：聚合查询

type

status

date

slug

summary

1、聚合查询介绍

聚合（aggregations）提供了从数据中分组和提取数据的能力。最简单的聚合方法大致等于SQL Group by 和 SQL 聚合函数。在 elasticsearch 中，执行搜索返回this（命中结果），并且同时返回聚合结果，把以响应中的所有hits（命中结果）分隔开的能力。这是非常强大且有效的，你可以执行查询和多个聚合，并且在一次使用中得到各自的（任何一个的）返回结果，使用一次简洁和简化的 API 来避免网络往返。聚合有以下类型：

桶集合（Bucket aggregations）：对查询出的数据进⾏分组group by，再在组上进⾏指标聚合。桶等同于组，分桶和分组是一个意思，ES使用桶代表一组相同特征的数据。

指标聚合（Metrics aggregations）：先对数据进行分组（分桶），然后对每一个桶内的数据进行指标聚合，例如求最⼤、最⼩、和、平均值、去重等指标的聚合。

管道聚合（Pipeline aggregations）：用的比较少。

聚合的语法如下：

aggregation_name：聚合名称，这个可以自己任意定义。因为ES支持一次进行多次统计分析查询，后面需要通过这个名字在查询结果中找到我们想要的计算结果。

aggregation_type：聚合类型，代表我们想要怎么统计数据，主要有两大类聚合类型：桶聚合和指标聚合，这两类聚合又包括多种聚合类型，例如：指标聚合：sum、avg，桶聚合：terms、Date histogram等等。

meta：元数据，用的比较少。

aggregations：子聚合，也就是说聚合里面还可以嵌套聚合。

aggregation_name_2：并列聚合名称，同一个 aggregations 下可以并列多个聚合名称，也就是可以一次进行多种类型的统计。

下面是一个简单使用示例，对 age 求平均值。

aggs：表示使用聚合统计，聚合要和 query 一起配合使用，才能对返回的数据进行统计。

avgAge：聚合名称，用户自定义名称。

avg：聚合类型，avg 表示求平均值，还可以使用 max 求最大值，min 求最小值，sum 求合等。

field：需要聚合的字段。

size：查询结果条数，0 表示不返回查询数据，只返回聚合结果。

聚合里面还可以嵌套聚合，例如按照年龄聚合，并且请求这些年龄段的这些人的平均薪资

2、桶集合

桶聚合，目的就是数据分组，先将数据按指定的条件分成多个组，然后对每一个组进行统计。组的概念跟桶是等同的，在ES中统一使用桶（bucket）这个术语。 ES桶聚合的作用跟 SQL 的 group by 的作用是一样的，区别是ES支持更加强大的数据分组能力，SQL 只能根据字段的唯一值进行分组，分组的数量跟字段的唯一值的数量相等，例如: group by 店铺id，去掉重复的店铺ID后，有多少个店铺就有多少个分组。 ES 常用的桶聚合如下：