搜索客，搜索人自己的社区

社区日报第878期 (2020-03-11)

社区日报 • 千夜发表了文章 • 0 个评论 • 1592 次浏览 • 2020-03-11 21:37 • 来自相关话题

packbeat如何为fields.yml文件添加字段?

Beats • crbEs 发起了问题 • 1 人关注 • 0 个回复 • 4724 次浏览 • 2020-03-11 17:58 • 来自相关话题

关于es集群扩充节点的问题

贡献

Elasticsearch • byx313 回复了问题 • 4 人关注 • 3 个回复 • 7531 次浏览 • 2020-03-15 22:47 • 来自相关话题

如何在ES里实现跨索引聚合?

Elasticsearch • hope_dream 回复了问题 • 1 人关注 • 1 个回复 • 6343 次浏览 • 2021-01-16 15:51 • 来自相关话题

目前Java开发工程师，需要掌握哪些知识？

贡献

Elasticsearch • doom 回复了问题 • 4 人关注 • 4 个回复 • 2680 次浏览 • 2020-03-28 19:35 • 来自相关话题

ES 错误更新字段【字段类型不匹配】

贡献

Elasticsearch • zqc0512 回复了问题 • 4 人关注 • 3 个回复 • 5442 次浏览 • 2020-03-18 09:22 • 来自相关话题

一种处理Elasticsearch对象数组类型的方式

Elasticsearch • trycatchfinal 发表了文章 • 0 个评论 • 8104 次浏览 • 2020-03-10 20:27 • 来自相关话题

目前情况

Elasticsearch中处理对象数组有两种格式array和nested，但这两种都有一定的不足。
以下面的文档为例：
 { "user": [ { "first": "John", "last": "Smith" }, { "first": "Alice", "last": "White" } ] } 
如果在mapping中以array存储，那么实际存储为：
 user.first:["John","Alice"] user.last:["Smith","White"] 
如果以must的方式查询user.first:John和user.last:White,那么这篇文档也会命中,这不是我们期望的。

如果在mapping中以array存储，Elasticsearch将每个对象视为一个doc，这例子会存储3个doc，会严重影响ES写入和查询的效率。

Flatten格式

我想到的存储方式很简单，就是将对象数组打平保存为一个keyword类型的字符串数组，故起名Flatten格式。
以上面文档为例,数组对象需要转换为下面的格式

 "user.flatten": [ "first:John", "last:Smith", "first:John&last:Smith", "first:Alice", "last:White", "first:Alice&last:White" ] 

这样以must的方式查询user.first:John和user.last:White，可以转换为term查询first:John&last:White,并不会命中文档。
同时，这种方式还是保存1个doc，避免了nested的缺点。

对于flatten格式有几点说明