总是有一个机器的节点报错collector [node_stats] timed out when collecting data
Elasticsearch | 作者 jiangxiaoyao | 发布于2022年08月26日 | 阅读数:1197
我们的一个es集群有好10几台物理机,每个物理机部署了三个节点,总是有个物理机上的三个节点间歇性报错日志
collector [node_stats] timed out when collecting data,这个报错特点是均在同一台物理机,三个节点都有,大致是连master超时吧。
于是我们主动下掉了这个物理机的三个节点后,报错又切换到另一台物理机的三个节点了。这种报错导致集群性能查询有影响。
gc什么的正常,其它日志没有有效信息
有什么思路可以排查吗
collector [node_stats] timed out when collecting data,这个报错特点是均在同一台物理机,三个节点都有,大致是连master超时吧。
于是我们主动下掉了这个物理机的三个节点后,报错又切换到另一台物理机的三个节点了。这种报错导致集群性能查询有影响。
gc什么的正常,其它日志没有有效信息
有什么思路可以排查吗
2 个回复
tongchuan1992 - 学无止境、学以致用
赞同来自:
Charele - Cisco4321
赞同来自:
2 贴出完整的报错信息