项目中使用fluent-bit和ES来做log的收集,最近发现每天早上的时候ES集群的节点会的cpu和memory会飙升,报警。
查看GET _nodes/hot_threads 和 GET /_cat/tasks 发现cpu被大量的write给占用了。
平时集群的cpu只会到25%左右,报警的时候会彪到70%-90%,现在想升级集群,增加节点不太可能,没这个预算。所以想先找到是哪边在大量写入。请问一下,该如何找到是哪台机器上的fluent-bit在大量写入啊?
ES版本:6.6.2
集群信息:
3个节点
每个节点 内存64G 分配给es31G 磁盘2T 16核非高速cpu
查看GET _nodes/hot_threads 和 GET /_cat/tasks 发现cpu被大量的write给占用了。
平时集群的cpu只会到25%左右,报警的时候会彪到70%-90%,现在想升级集群,增加节点不太可能,没这个预算。所以想先找到是哪边在大量写入。请问一下,该如何找到是哪台机器上的fluent-bit在大量写入啊?
ES版本:6.6.2
集群信息:
3个节点
每个节点 内存64G 分配给es31G 磁盘2T 16核非高速cpu
2 个回复
luohuanfeng
赞同来自:
JackMusk - Jack Mush Pony awesome
赞同来自: