elasticsearch中index有40多个，shard共有800个。用spark-es工具插入数据特别慢。

Elasticsearch | 作者 Vbeifeng | 发布于2018年04月11日 | 阅读数：2713

目前有8个节点的es集群。和其他服务公用资源。在使用spark插入数据的时候特慢。是因为shard太多这个原因吗

2 个回复

能给出每个节点的配置情况么？如内存配置，磁盘类型，最好有个elasticsearch.yml配置文件的截图
个人认为，分片多对写入应该没什么大影响。首先在排除ES集群自身吞吐量，索引速度没问题的前提下，建议可以适当给插入数据的工程增加内存，提高（进入ES之前）插入数据的速度。
可以了解一下写入原理：Elasticsearch 写入流程简介
分片优化方面：ES节点及分片常见分配规则和ES优化方案
写入优化：将 ELASTICSEARCH 写入速度优化到极限

yayg2008

先要确认哪里耗时，是ES服务本身，还是spark-es工具插入速度的限制?
如果ES服务本身已经被插的负载很高了，那再结合index进行写入优化即可。

要回复问题请先登录或注册

elasticsearch中index有40多个，shard共有800个。用spark-es工具插入数据特别慢。

2 个回复

发起人

活动推荐

相关问题

问题状态

elasticsearch中index有40多个，shard共有800个。用spark-es工具插入数据特别慢。

与内容相关的链接

2 个回复

发起人

活动推荐

相关问题

问题状态