top_hits指标聚合器跟踪要聚合的最相关文档。该聚合器旨在用作子聚合器，以便可以按存储分区汇总最匹配的文档。

top_hits聚合器可以有效地用于通过存储桶聚合器按某些字段对结果集进行分组。一个或多个存储桶聚合器确定将结果集切成哪些属性。

选项：

from-要获取的第一个结果的偏移量。
size-每个存储桶要返回的最匹配匹配项的最大数目。默认情况下，返回前三个匹配项。
排序-匹配的热门匹配的排序方式。默认情况下，命中按主要查询的分数排序。

我们还是来用一个例子来展示如何使用这个：

准备数据：

我们选用Kibana里带的官方的Sample web logs来作为我们的索引：

然后加载我们的索引：

这样我们的数据就加载完成了。

Top hits aggregation

首先，我们先做一个简单的基于hosts的aggregation:

GET kibana_sample_data_logs/_search
{"size": 0,"aggs": {"hosts": {"terms": {"field": "host.keyword","size": 2
      }
    }
  }
}

上面的搜索的结果是我们想得到2个桶的数据（这里为了说明问题的方便，设定为2）。而这两个桶是基于hosts的值。搜索的结果是：

"aggregations" : {"hosts" : {"doc_count_error_upper_bound" : 0,"sum_other_doc_count" : 2807,"buckets" : [
        {"key" : "artifacts.elastic.co","doc_count" : 6488
        },
        {"key" : "www.elastic.co","doc_count" : 4779
        }
      ]
    }
  }

现在的要求是：我们想针对这里的每个桶得到按照我们需要排序的前面的几个结果，比如下面的搜索：

GET kibana_sample_data_logs/_search
{"size": 0,"aggs": {"hosts": {"terms": {"field": "host.keyword","size": 2
      },"aggs": {"most_bytes": {"top_hits": {"sort": [
              {"bytes": {"order": "desc"
                }
              }
            ],"_source": {"includes": ["bytes","hosts","ip","clientip"
              ]
            },"size": 2
          }
        }
      }
    }
  }
}

上面实际上市一个pipleline的聚合。它在针对上面的桶来做了一个top_hits的聚合。针对每个桶，我们需要安装bytes的大小，降序排列，并且每个桶只需要两个数据：

"aggregations" : {"hosts" : {"doc_count_error_upper_bound" : 0,"sum_other_doc_count" : 2807,"buckets" : [
        {"key" : "artifacts.elastic.co","doc_count" : 6488,"most_bytes" : {"hits" : {"total" : {"value" : 6488,"relation" : "eq"
              },"max_score" : null,"hits" : [
                {"_index" : "kibana_sample_data_logs","_type" : "_doc","_id" : "dnNIHm8BjrINWI3xXlRc","_score" : null,"_source" : {"bytes" : 19929,"ip" : "127.155.255.9","clientip" : "127.155.255.9"
                  },"sort" : [
                    19929
                  ]
                },
                {"_index" : "kibana_sample_data_logs","_type" : "_doc","_id" : "OXNIHm8BjrINWI3xX1td","_score" : null,"_source" : {"bytes" : 19904,"ip" : "100.177.58.231","clientip" : "100.177.58.231"
                  },"sort" : [
                    19904
                  ]
                }
              ]
            }
          }
        },
        {"key" : "www.elastic.co","doc_count" : 4779,"most_bytes" : {"hits" : {"total" : {"value" : 4779,"relation" : "eq"
              },"max_score" : null,"hits" : [
                {"_index" : "kibana_sample_data_logs","_type" : "_doc","_id" : "4nNIHm8BjrINWI3xYWQl","_score" : null,"_source" : {"bytes" : 19986,"ip" : "233.204.30.48","clientip" : "233.204.30.48"
                  },"sort" : [
                    19986
                  ]
                },
                {"_index" : "kibana_sample_data_logs","_type" : "_doc","_id" : "wnNIHm8BjrINWI3xW0Rj","_score" : null,"_source" : {"bytes" : 19956,"ip" : "129.237.102.30","clientip" : "129.237.102.30"
                  },"sort" : [
                    19956
                  ]
                }
              ]
            }
          }
        }
      ]
    }
  }

从上面的返回结果可以看出来两个hosts artifacts.elastic.co及www.elastic.co各返回两个结果，并且它们是按照bytes的大小进行降序排列的。

细心的读者可能会发现这个和我之前介绍的field collapsing有些类似。只是field collapsing里针对每个桶有一个结果，并且是按照我们的要求进行排序的最高结果的那个。当然我们也可以含有多几个返回结果在inner_hits之中。

参考：
【1】 https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-metrics-top-hits-aggregation.html

Elasticsearch：top_hits 聚合去重 aggregation - 三度 - 博客园

准备数据：

Top hits aggregation

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本