即使是不成熟的尝试,也胜于胎死腹中的策略。

两个数据中心,是搭建一个大的ES集群,还是搭建两个小的ES集群然后实现集群间数据同步

Elasticsearch | 作者 zping | 发布于2021年01月14日 | 阅读数:2116

需求:增量数据在每天凌晨1点写入,要求A数据中心能查询到数据,同时B数据中心也能查询到数据。这种要求的话该怎么做,是A数据中心和B数据中心共同搭建一个ES大集群还是A数据中心搭建一个集群,B数据中心搭建一个集群,然后实现A数据中心和B数据中心的数据同步,有大神能解答下吗?
已邀请:

JiangJibo - 喊我雷锋

赞同来自: medcl

看连个数据中心的网络,如果AB离得很远,那强行弄成一个数据中心会导致数据处理延迟高,不好;如果数据中心离得不远,且网络带宽足够,可以弄成一个数据中心

zping - 保护发际线

赞同来自:

我现在就搭建了一个大集群,然后模拟A数据中心和B数据中心断网情况,发现如果断网了,再查询这个集群中的索引数据有点问题,有的数据能立即查询出来,有的数据不能立即查询出来;但是如果我把一个数据中心的es服务都关掉,再查询集群的索引数据是能立即查出来的,这个现象令人费解,望大神解惑。

JiangJibo - 喊我雷锋

赞同来自:

客户端的请求是发送到某台机器上,然后由这台机器分发到所有包含数据的节点上的。假设你的请求发到了A上的一台机器,由这台机器分发到整个集群上,如果查询的数据在有些落在B上,AB网络不通,就查询不到。把一个数据中心关掉,那就相当于你的集群就一个服务中心,数据都在一个服务中心上,自然能查询到。

要回复问题请先登录注册