不为失败找理由,要为成功找方法。

es集群主节点会因为短时间内大量查询导致OOM吗?之后生成的.hprof文件该怎么处理?

Elasticsearch | 作者 ESWorker | 发布于2018年04月10日 | 阅读数:7932

情况是这样的,在进行了一次几百万数据量的查询测试之后,主节点响应突然很慢,不知道是不是这次查询造成的?
然后我重启了主机节点依然很慢(现象就是head插件的页面刷新找不到集群了,但ES后台还在运行。)
本想着可能也和网络有关,想观察下,看ES能自己处理完不?....就等了一两天,结果主节点挂了。
../config目录里生成了.hprof文件。这是内存溢出的表现。那其原因会是查询的数据量大导致的?还是其他任务启动导致内存紧张呢?
求各位前辈帮我分析分析。。
QQ图片20180410090602.png

 
已邀请:

yayg2008

赞同来自: ESWorker

线上应用一定要把节点角色分开,master,data,coordinate,ingrest。避免相互干扰。
index,cache,fileddata,docvalues都会占用内存,默认各个占用阈值之和是大于100%的,即当各个事件都在争抢内存时,会溢出。建议开启内存熔断器。

medcl - 今晚打老虎。

赞同来自: ESWorker

es版本呢?这些基本信息都要补充一些,
看样子就是查询压挂的,dump文件可以打开再分析一下,重点是使用新的es版本和优化查询以及限制不合理的查询

jlhde123

赞同来自:

有使用kibana么,看下各个内存使用情况

要回复问题请先登录注册