身安不如心安,屋宽不如心宽 。

Master节点互相加入集群失败

Elasticsearch | 作者 pengweinan | 发布于2020年11月28日 | 阅读数:1562

我们的业务场景的elk日志集群,版本目前用的是elasticsearch开源版本7.6.2,因为每天8点会批量创建索引+mapping,为了避免master大面积pending task,所以我每天凌晨会预创建第二天的索引(不带mapping),但是最近一个月频繁在8点发生master断联现象,虽然后续master进行了切换,但是仍然出现这个现象,导致master互相无法join进去,导致集群崩溃,解决方式只有重启三台master节点,然后重新进行选举,但是这个根本问题仍然没法解决,我初步排查应该是master在批量更新元数据期间有阻塞,但是不知道从哪方面入手去解决,去官网找了相关参数,但是没效果,所以还请各位论坛老师帮忙分析,看看是否遇到过类似现象和解决方案,特别感谢!
线程1.png master1.png 线程2.png
已邀请:

locatelli

赞同来自:

硬盘写太慢,用的不是SSD?或者看一下I/O
 

JiangJibo - 喊我雷锋

赞同来自:

remote address 53054,这个远程服务是干嘛的?日志上写的本地9300和远程的53054端口握手异常

要回复问题请先登录注册