这几天遇到一个问题很奇怪,集群24个节点,资源不足需要扩容,结果扩容两个机器后,这两个机器es进程的gc非常厉害,成为整个机器短板导致请求超时非常多。下掉以后就没事儿了,后来重新部署,gc又上来了,重启后没多久还是这样。
索引不到200个,按时间拆分业务的(集群上只有这一个业务),分片总共7800个。
目前能检测到的 有一些任务每隔一段时间(1小时2次左右)会跑一些慢查询(20多s。。),但是按说慢查询跑完gc应该就下去了,不明白为什么会一直下不去,最后只能重启解决。
不知道有没有人和我遇到一样的问题。
索引不到200个,按时间拆分业务的(集群上只有这一个业务),分片总共7800个。
目前能检测到的 有一些任务每隔一段时间(1小时2次左右)会跑一些慢查询(20多s。。),但是按说慢查询跑完gc应该就下去了,不明白为什么会一直下不去,最后只能重启解决。
不知道有没有人和我遇到一样的问题。
1 个回复
weizijun - elasticsearch fan
赞同来自: