看,灰机...

总是有一个机器的节点报错collector [node_stats] timed out when collecting data

Elasticsearch | 作者 jiangxiaoyao | 发布于2022年08月26日 | 阅读数:1197

我们的一个es集群有好10几台物理机,每个物理机部署了三个节点,总是有个物理机上的三个节点间歇性报错日志
 
collector [node_stats] timed out when collecting data,这个报错特点是均在同一台物理机,三个节点都有,大致是连master超时吧。
 
于是我们主动下掉了这个物理机的三个节点后,报错又切换到另一台物理机的三个节点了。这种报错导致集群性能查询有影响。
gc什么的正常,其它日志没有有效信息
 
有什么思路可以排查吗 
已邀请:

tongchuan1992 - 学无止境、学以致用

赞同来自:

如果是机器性能没有问题,单纯的超时的话,把超时时间该大一点,不影响使用。

Charele - Cisco4321

赞同来自:

1 用_cat/nodes看下报错的这3个节点是不是在集群里面
 
2 贴出完整的报错信息

要回复问题请先登录注册