ES版本:5.0.2 JDK:1.8 HEAP:30g
节点: 两个数据节点,1个主节点
现在的情况是数据节点探测主节点时出现failed to ping,每次会有一个数据节点从集群中脱离,然后恢复正常,数据量目前总共才350G,索引:130个,按日建立索引。
监控服务器CPU使用率等比较正常,但是看jvm频繁发生gc
39.16 0.00 83.36 54.05 93.78 85.29 10864 321.479 4 0.437 321.916
0.00 42.14 51.27 54.05 93.78 85.29 10865 321.508 4 0.437 321.945
47.26 0.00 1.14 54.06 93.78 85.29 10866 321.536 4 0.437 321.973
47.26 0.00 90.52 54.06 93.78 85.29 10866 321.536 4 0.437 321.973
50.43 0.00 11.97 54.08 93.78 85.29 10868 321.591 4 0.437 322.028
50.43 0.00 74.84 54.08 93.78 85.29 10868 321.591 4 0.437 322.028
0.00 49.79 63.93 54.09 93.78 85.29 10869 321.619 4 0.437 322.056
43.68 0.00 14.73 54.10 93.78 85.29 10870 321.645 4 0.437 322.082
43.68 0.00 99.70 54.10 93.78 85.29 10871 321.645 4 0.437 322.082
0.00 28.15 64.35 54.10 93.78 85.29 10871 321.671 4 0.437 322.108
36.91 0.00 10.33 54.11 93.78 85.29 10872 321.700 4 0.437 322.137
0.00 27.68 7.45 54.13 93.78 85.29 10873 321.727 4 0.437 322.164
0.00 27.68 49.54 54.13 93.78 85.29 10873 321.727 4 0.437 322.164
0.00 25.21 99.03 54.53 93.78 85.29 10876 321.845 4 0.437 322.282
20.50 0.00 47.84 54.53 93.78 85.29 10876 321.865 4 0.437 322.302
0.00 24.12 11.41 54.53 93.78 85.29 10877 321.888 4 0.437 322.325
======================
不知道这种情况应该如何优化。。。。
节点: 两个数据节点,1个主节点
现在的情况是数据节点探测主节点时出现failed to ping,每次会有一个数据节点从集群中脱离,然后恢复正常,数据量目前总共才350G,索引:130个,按日建立索引。
监控服务器CPU使用率等比较正常,但是看jvm频繁发生gc
39.16 0.00 83.36 54.05 93.78 85.29 10864 321.479 4 0.437 321.916
0.00 42.14 51.27 54.05 93.78 85.29 10865 321.508 4 0.437 321.945
47.26 0.00 1.14 54.06 93.78 85.29 10866 321.536 4 0.437 321.973
47.26 0.00 90.52 54.06 93.78 85.29 10866 321.536 4 0.437 321.973
50.43 0.00 11.97 54.08 93.78 85.29 10868 321.591 4 0.437 322.028
50.43 0.00 74.84 54.08 93.78 85.29 10868 321.591 4 0.437 322.028
0.00 49.79 63.93 54.09 93.78 85.29 10869 321.619 4 0.437 322.056
43.68 0.00 14.73 54.10 93.78 85.29 10870 321.645 4 0.437 322.082
43.68 0.00 99.70 54.10 93.78 85.29 10871 321.645 4 0.437 322.082
0.00 28.15 64.35 54.10 93.78 85.29 10871 321.671 4 0.437 322.108
36.91 0.00 10.33 54.11 93.78 85.29 10872 321.700 4 0.437 322.137
0.00 27.68 7.45 54.13 93.78 85.29 10873 321.727 4 0.437 322.164
0.00 27.68 49.54 54.13 93.78 85.29 10873 321.727 4 0.437 322.164
0.00 25.21 99.03 54.53 93.78 85.29 10876 321.845 4 0.437 322.282
20.50 0.00 47.84 54.53 93.78 85.29 10876 321.865 4 0.437 322.302
0.00 24.12 11.41 54.53 93.78 85.29 10877 321.888 4 0.437 322.325
======================
不知道这种情况应该如何优化。。。。
1 个回复
sbjatqdx
赞同来自:
调整如下参数:
net.ipv4.tcp_keepalive_time = 600
net.ipv4.tcp_keepalive_intvl = 60
net.ipv4.tcp_keepalive_probes = 20
不过没用,还是脱离集群,后来调整了JVM的 -Xmn参数,增加到了8G (heap 30G),目前来看暂时正常
thread_pool.bulk.queue_size: 5000