三人行必有我师

ES单个索引最佳存储多大数据量?

Elasticsearch | 作者 jianjianhe | 发布于2017年11月20日 | 阅读数:37130

开始这样设计es索引,为了方便管理,保持hbase单个region和es单个索引对应,即hbase中的一个region对应一个es索引,如果当月数据过大,发生region split,es那边同样创建新index。即正常情况下,一个月数据存储在一个hbase的region,(一个region大小设为是10g)索引对应es中的一个index,如果当月数据过大,一个月数据存储多个region中,索引对应es中的多个index。后来,发现一个月的数据对应一个索引,这样是不是影响检索性能,我想请教下各位,一个es索引最佳存储大小为多少?
已邀请:

laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自:

避免有非常大的分片,因为大的分片可能会对集群从故障中恢复的能力产生负面影响。 对于多大的分片没有固定的限制,但是分片大小为50GB通常被界定为适用于各种用例的限制
http://blog.csdn.net/laoyang36 ... 80602

要回复问题请先登录注册