你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
发现
分享
文章
活动
登录
找到问题的解决办法了么?
稀疏索引字段是否对性能有影响?
Elasticsearch
| 作者
ggh666
| 发布于2017年09月14日 | 阅读数:
5625
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
向一个索引中插入数据:90%的数据是10个字段,10%的数据可能有100+个字段(打个比方)
这时会有什么性能上的问题吗 创建索引 或者搜索的时候 ?
没有找到相关结果
已邀请:
与内容相关的链接
提交
1 个回复
kennywu76
-
Wood
赞同来自:
rockybean
对于索引和搜索都有性能影响! Lucene的Post list是用文档id做delta编码压缩的,稀疏的数据会使得相邻文档id的delta值很大,post list压缩率降低,因此生成的索引文件增大。另外为了加快排序和聚合速度,ES还会为keyword,数值型一类的机构化字段构建列式存储结构doc values,根据字段类型,每个文档都会占用一块空间,即使是空值。 因此稀疏的数据,doc values的存储效率也会降低得很厉害,生成的索引文件也会比较大。 在文档数量多到一定程度时,写入和查询的速度都会下降得很厉害。
要回复问题请先
登录
或
注册
发起人
ggh666
热爱生活
活动推荐
Aug
15
2025 Zabbix 中国峰会
上海
·
8-15 周五
·
报名中
Oct
17
第27届 GOPS 全球运维大会暨研运数智化技术峰会 · 上海站
上海
·
10-17 周五
·
报名中
相关问题
bulk update 重复的文档id 导致更新性能下降?
除了设置mapping为not analyzied,还有其他方法让一个string字段不分词吗?
Elastic对类似枚举数据的搜索性能优化
elasticsearch 中的store 以及倒排索引的问题
索引某个shard无法恢复的问题
kibana是否可以画关系网图?
集群索引数建议?
elasticsearch如何为类型添加字段并赋初值
Elasticsearch内存配置成系统内存的50%是否合理?
query_string查询多值字段问题请教
logstash向es里面导入mysql数据,表字段名称自动变成了小写
问题状态
最新活动:
2017-09-14 21:18
浏览:
5625
关注:
6
人
1 个回复
kennywu76 - Wood
赞同来自: rockybean