- 先说场景:我们想通过es,使用 [用户访问明] 细计算出汇总在 [用户粒度] 上的数据分布情况,比如计算出访问某特定页面的用户访问量均值、方差
- 解决办法:我们通过es的 pipeline aggregation 的方式对数据进行了2次聚合,第二次聚合出的数据就是我们想要的最终结果 sample 代码 pipeline_bucket_agg_sample.json
- 问题:但是现在的问题是这种方法不仅把最终的二次聚合结果返回了,第一次聚合出的用户明细也返回了,第一次聚合出的数据不仅数据量大而且对我们并没用处,想问问看是否有办法在ES计算好Agg后,限制从ES返回的数据内容,对我们这个例子来说就是不希望接收到 vid + pv 的明细数据
- 附结果链接:
- sample 的运行结果 pipeline_bucket_agg_sample_result.json
- 更改了size后的 pipeline_bucket_agg_sample_size1.json,以及运行结果 pipeline_bucket_agg_sample_size1_result.json
1 个回复
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
赞同来自: