我们的日志集群有四个节点,其中有一个节点和其他三个节点相比,磁盘小一半,别的指标都是完全一样的,都是ssd。
近期发现在写高峰期的时候,磁盘较大的三个节点cpu load都飙上去了(超过核数),而磁盘小的那个节点load似乎很正常(核数*0.7左右),而且磁盘小的那个节点的磁盘占用率实际只有一半。
观察了下比较占用cpu的线程都是es的bulk线程,iowait也蛮低的。就是感觉磁盘小的机器怎么也利用不起来,按照目前的情形,就怕后续加机器也没法达到负载平衡。 求教有没有遇到这种情况的呢
近期发现在写高峰期的时候,磁盘较大的三个节点cpu load都飙上去了(超过核数),而磁盘小的那个节点load似乎很正常(核数*0.7左右),而且磁盘小的那个节点的磁盘占用率实际只有一半。
观察了下比较占用cpu的线程都是es的bulk线程,iowait也蛮低的。就是感觉磁盘小的机器怎么也利用不起来,按照目前的情形,就怕后续加机器也没法达到负载平衡。 求教有没有遇到这种情况的呢
2 个回复
zqc0512 - andy zhou
赞同来自:
"allocation" : { "disk" : { "watermark" : { "low" : "85%", "high" : "100gb" } },
有个平衡的。把这几个值调整下,
小的SSD可能硬盘快满了吧。
wangzehao
赞同来自: