绊脚石乃是进身之阶。

Elasticsearch数据迁移问题, 从2.x到5.x?

Elasticsearch | 作者 exceptions | 发布于2017年07月20日 | 阅读数:4520

目前有一个数据迁移任务,从2.x版本迁移到5.x版本。尝试过Elasticsearch的_reindex API和elastic-dump这个工具。这两个方法都在数据量小或者数据量不大的情况下能完成,当时数据量比较大就会失败。_reindex是端口连接失败了,elasticdump是突然停掉。现在想考虑快照方式,通过2.x版本将快照备份到hdfs上,5.x能否通过快照恢复数据?有试过这种方案的大神吗?
已邀请:

shinehiy

赞同来自:

5.x 数据的格式变动,不知道直接通过快照的方式,能不能奏效
是我的话,手动搞了...批量拉出来,再写入

BrickXu - BlackOps@Qunar

赞同来自:

snapshot方式是一定OK的,并且数据重新按照新版本结构写入,没那么多屁事。_reindex本身就是knapshot的官方实现,都是scroll + bulk写的,并发一大就reject了,整体数据迁移直接考虑snapshot + restore,没坑。

要回复问题请先登录注册