要不要再翻翻文档呢?

关于重启节点后,分片恢复时间的疑问

Elasticsearch | 作者 wangxinrong | 发布于2019年06月28日 | 阅读数:2633

一般节点重启时,我是按照标准操作来的:
1.禁用节点自动分配
2.重启节点
3.启用节点自动分配

这时分片恢复一般会比较快,基本上是立刻就恢复了,但当天有数据写入的索引,仍然要等很久才能恢复。
我之前以为是这个重启的间歇,有新数据写入,即使原来已写入的部分很快恢复了,也还要继续等这期间差额的部分给同步到才能完成全部恢复操作。
但最近操作让我感觉不是这样,原因有几个:
1.节点重启很快,总共5分钟不到,但有数据写入的那个索引,即使数据写入量不大也用了很久才恢复,这么久应该不是在等待重启间歇的数据同步完成。
2.数据是每天8点写入新索引,假如我在6.28号的8点多一点的时候做节点重启操作,6.27号的索引仍然用了很久才恢复。
3.白天10点、11点的时候做重启操作,集群恢复时间比夜里做还要快很多。

观察下来我感觉有新数据写入的索引,和数据已写入完成一段时间的索引相比,在恢复上应该是有什么特殊之处。上面说的几个现象,我猜测应该是:
6.27号夜里执行操作,比6.28号早上执行操作恢复慢,是因为6.27号当天索引的全部数据恢复都慢,而6.28因为写入的量不多,所以整体恢复要比27号的快

不知我的猜测是不是对,有没有什么依据支持这个猜测。如果是真的话,那应该是尽量找当天数据刚写入不久的时间来操作,而不是数据写入量最大的时间操作,应该是这样吧?
已邀请:

要回复问题请先登录注册