文章 - 搜索客，搜索人自己的社区

【搜索客社区日报】第1757期 (2023-12-18）

1、Elasticsearch之利用bulk提高写入性能（含源码分析）
https://cloud.tencent.com/deve ... 11300
2、从ElasticSearch看批处理的性能优势
https://blog.csdn.net/BASK2311 ... 44821
3、Elasticsearch：提升 Elasticsearch 性能
https://blog.csdn.net/UbuntuTo ... 17932
4. ElasticSearch - 批量更新 bulk 死锁问题排查
https://zhuanlan.zhihu.com/p/641637205
5、ElasticSearch源码：Cluster--ClusterState
https://zhuanlan.zhihu.com/p/629394258

编辑：yuebancanghai
更多资讯：http://news.searchkit.cn

继续阅读 »

极限科技（INFINI labs）荣获中国信通院大数据“星河”数据库标杆案例

12 月 6 日，由中国信息通信研究院和中国通信标准化协会大数据技术标准推进委员会（CCSA TC601）共同组织的 2023 大数据“星河（Galaxy）”案例评选结果正式公示。极限数据（北京）有限公司（INFINI labs）与中移互联网有限公司、中移（苏州）软件技术有限公司移动云搜索数据库案例荣选为数据库标杆案例。

历经多环节严苛评审，从累计 706 份申报项目中脱颖而出，荣获数据库标杆案例。党中央、国务院高度重视大数据产业发展，推动实施国家大数据战略。为更好推进大数据技术产品及相关产业的繁荣，充分发挥数据作为生产要素的独特价值，大数据“星河（Galaxy）”案例征集活动迄今已成功举办 7 届，在业内具有较强的权威性和影响力。案例征集自 9 月启动以来，受到了业界广泛关注和踊跃报名，共收到申报项目 706 份，涵盖行业数据应用、数据安全、数据要素流通、数据资产管理、数据库、以及数据向善六大方向。

由极限数据（北京）有限公司（INFINI labs）联合中移互联网有限公司、中移（苏州）软件技术有限公司联合申报移动云搜索数据库案例,基于移动云数据库，首创多集群协同模式，同时通过优化 ES 批量写入及分拆重组技术，实现数量级下数据高性能存取，为云盘日志搜索分析和监控告警及通过语义分析的智能关联搜索奠定海量存储及高性能查询基；产出 PB 级数据高性能存取标准解决方案，助力云能力中心搜索引擎产品体系化能力沉淀；进一步升级泛在云存储底座能力，助力行业数字化转型，具有较高的经济价值和社会价值。

未来，极限科技将继续深耕大数据搜索领域，以创新为驱动，不断推动大数据搜索技术的进步和发展。同时，也将加强与各行业合作伙伴的深度合作，共同推动大数据搜索技术的进步和发展，为用户提供更优质、更全面的大数据解决方案。

继续阅读 »

12 月 6 日，由中国信息通信研究院和中国通信标准化协会大数据技术标准推进委员会（CCSA TC601）共同组织的 2023 大数据“星河（Galaxy）”案例评选结果正式公示。极限数据（北京）有限公司（INFINI labs）与中移互联网有限公司、中移（苏州）软件技术有限公司移动云搜索数据库案例荣选为数据库标杆案例。

历经多环节严苛评审，从累计 706 份申报项目中脱颖而出，荣获数据库标杆案例。党中央、国务院高度重视大数据产业发展，推动实施国家大数据战略。为更好推进大数据技术产品及相关产业的繁荣，充分发挥数据作为生产要素的独特价值，大数据“星河（Galaxy）”案例征集活动迄今已成功举办 7 届，在业内具有较强的权威性和影响力。案例征集自 9 月启动以来，受到了业界广泛关注和踊跃报名，共收到申报项目 706 份，涵盖行业数据应用、数据安全、数据要素流通、数据资产管理、数据库、以及数据向善六大方向。

由极限数据（北京）有限公司（INFINI labs）联合中移互联网有限公司、中移（苏州）软件技术有限公司联合申报移动云搜索数据库案例,基于移动云数据库，首创多集群协同模式，同时通过优化 ES 批量写入及分拆重组技术，实现数量级下数据高性能存取，为云盘日志搜索分析和监控告警及通过语义分析的智能关联搜索奠定海量存储及高性能查询基；产出 PB 级数据高性能存取标准解决方案，助力云能力中心搜索引擎产品体系化能力沉淀；进一步升级泛在云存储底座能力，助力行业数字化转型，具有较高的经济价值和社会价值。

未来，极限科技将继续深耕大数据搜索领域，以创新为驱动，不断推动大数据搜索技术的进步和发展。同时，也将加强与各行业合作伙伴的深度合作，共同推动大数据搜索技术的进步和发展，为用户提供更优质、更全面的大数据解决方案。

收起阅读 »

INFINI Labs 产品更新 | Easysearch 新增快照搜索功能，Console 支持 OpenSearch 存储

INFINI Labs 产品又更新啦~，包括 Easysearch v1.7.0、Console v1.13.0。本次各产品更新了 Easysearch 快照搜索功能；Console 支持 OpenSearch 集群存储系统数据、优化了初始化安装向导流程等。

以下是本次更新的详细说明。

INFINI Easysearch v1.7.0

INFINI Easysearch 是一个分布式的近实时搜索与分析引擎，核心引擎基于开源的 Apache Lucene。Easysearch 的目标是提供一个轻量级的 Elasticsearch 可替代版本，并继续完善和支持更多的企业级功能。

Easysearch 本次更新如下：

Features

发布快照搜索功能 Beta 版本，此功能旨在提高对已备份数据的使用效率。让用户利用对象存储（如 AWS S3、MinIO、Microsoft Azure Storage、Google Cloud Storage 等）技术来大幅降低存储成本。

Bug fix

修复单个节点场景下，从快照恢复多个 shard 的索引时，恢复不完整的问题
修复无法删除索引已关联的 ILM 策略问题

Improvements

初始化脚本优化，新增重复执行判断

INFINI Console v1.12.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Features

支持 OpenSearch 集群存储系统数据

Bug fix

优化初始化安装流程
新增探针初始化配置
安装向导，新增凭据检查功能
安装向导，新增管理员密码重置功能
探针管理，支持自动关联 Auto Enroll

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://www.infinilabs.com

继续阅读 »

INFINI Labs 产品又更新啦~，包括 Easysearch v1.7.0、Console v1.13.0。本次各产品更新了 Easysearch 快照搜索功能；Console 支持 OpenSearch 集群存储系统数据、优化了初始化安装向导流程等。

以下是本次更新的详细说明。

INFINI Easysearch v1.7.0

INFINI Easysearch 是一个分布式的近实时搜索与分析引擎，核心引擎基于开源的 Apache Lucene。Easysearch 的目标是提供一个轻量级的 Elasticsearch 可替代版本，并继续完善和支持更多的企业级功能。

Easysearch 本次更新如下：

Features

发布快照搜索功能 Beta 版本，此功能旨在提高对已备份数据的使用效率。让用户利用对象存储（如 AWS S3、MinIO、Microsoft Azure Storage、Google Cloud Storage 等）技术来大幅降低存储成本。

Bug fix

修复单个节点场景下，从快照恢复多个 shard 的索引时，恢复不完整的问题
修复无法删除索引已关联的 ILM 策略问题

Improvements

初始化脚本优化，新增重复执行判断

INFINI Console v1.12.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Features

支持 OpenSearch 集群存储系统数据

Bug fix

优化初始化安装流程
新增探针初始化配置
安装向导，新增凭据检查功能
安装向导，新增管理员密码重置功能
探针管理，支持自动关联 Auto Enroll

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://www.infinilabs.com

收起阅读 »

【 INFINI Workshop 北京站】1月18日一起动手实验玩转 Easysearch

与 INFINI Labs 的技术专家面对面，第一时间了解极限实验室的发布最新产品和功能特性，通过动手实战，快速掌握最前沿的搜索技术，并用于实际项目中。欢迎大家扫描海报二维码免费报名参加。

活动时间：2024-01-18 13:30～17:30

活动地点：北京市海淀区 Wework 辉煌时代大厦 3 楼 3E 会议室

分享议题

Easysearch 总体介绍及搭建实战
基于 INFINI Console 实现跨版本、跨引擎统一管控
Elasticsearch -> Easysearch 在线迁移实操

参会提示

请务必自备电脑（Windows 系统环境请提前安装好 Linux 虚拟机）
请提前在 INFINI Labs 官网下载对应平台最新安装包（INFINI Easysearch、INFINI Gateway、INFINI Console）
下载地址：https://www.infinilabs.com/download
如有任何疑问可添加 INFINI Labs 小助手（微信号: INFINI-Labs）进行联系

继续阅读 »

【搜索客社区日报】第1756期 (2023-12-14）

1.为 Hugo 网站添加 Elastic RUM 用户体验监控
https://mp.weixin.qq.com/s/CXskhLa4I1Y4sPZGRM-n4w
2.计算 Elastic Agent 和 Elasticsearch 之间的延迟（需要梯子）
https://medium.com/squareshift ... 8c578
3.大规模实时流处理：集成 Apache Flink、Kafka、Postgres、Elasticsearch、Kibana 和 Docker（需要梯子）
https://blog.stackademic.com/r ... 59e00
4.可视化 Lucene 上的段合并
https://blog.mikemccandless.co ... .html
5.如何解决 5 个 Elasticsearch 性能和扩展问题
https://www.datadoghq.com/blog ... lems/

编辑：Se7en
更多资讯：http://news.searchkit.cn

继续阅读 »

搜索客社区日报第1755期 (2023-12-13）

1.超干货！一文概览 NLP 算法
https://blog.csdn.net/dQCFKyQD ... 76584
2.Elasticsearch：向量数据库的真相
https://blog.csdn.net/UbuntuTo ... 03878
3.Elasticsearch：为现代搜索工作流程和生成式人工智能应用程序铺平道路
https://blog.csdn.net/UbuntuTo ... 35908
4. 两万字详解，吃透 ES
https://mp.weixin.qq.com/s/2vVL5BwJcKHuW0EMzjuelw

编辑：kin122
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1754期 (2023-12-12）

1、ElasticON AI 2023大会回顾
https://mp.weixin.qq.com/s/oeWGbg9Zc6egxc4QefbZgw
2、小红书推搜场景下如何优化机器学习异构硬件推理突破算力瓶颈！
https://zhuanlan.zhihu.com/p/670350407
3、线上ES集群参数配置引起的业务异常案例分析
https://mp.weixin.qq.com/s/Ye6v8D_kRE_KxGNDp9OV1g
4.【腾讯云ES】Elasticsearch 分布式架构剖析及扩展性优化
https://cloud.tencent.com/deve ... 68895
5、Elasticsearch 轻量级搜索中台实践--Alpha
https://mp.weixin.qq.com/s/SszyZ2Pjs6nuw0bpPyJRhA

编辑：yuebancanghai
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1753期 (2023-12-11）

1. 一个可视化模拟LLM运算的站点
https://bbycroft.net/llm
2. 在GCP里索引向量数据嗖嗖的，你也可以（需要梯子）
https://medium.com/google-clou ... 34f7f
3. 一个输出了不少干货的老哥可以关注一下，下面那篇就是他写的（需要梯子）
https://medium.com/@sanilkhurana7
4. 系统设计小抄 —— ES篇（需要梯子）
https://towardsdatascience.com ... ebfff

编辑：斯蒂文
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1752期 (2023-12-07）

1. AI+搜索｜关于搜索的想象，和目前估值最高的生成式搜索引擎 Perplexity
https://mp.weixin.qq.com/s/0zUQFixXQ9vwWTCIR_b1iA

2. 零故障实战：万亿级Elasticsearch集群节点迁移
https://dbaplus.cn/news-73-5352-1.html

3. Elasticsearch核心应用场景-日志优化实践
https://cloud.tencent.com/deve ... 02427

4. Elastcsearch：通过 Serverless 提供更多服务
https://elasticstack.blog.csdn ... %253D

5. Grafana还是ELK？— 实用比较分析（第 1 部分）（需要梯子）
https://levelup.gitconnected.c ... 32ec0

6. Grafana还是ELK？— 性能评估（第 2 部分）（需要梯子）
https://levelup.gitconnected.c ... 147ae

编辑：Se7en
更多资讯：http://news.searchkit.cn

继续阅读 »

搜索客社区日报第1751期 (2023-12-06）

1.Elasticsearch：评估 RAG - 指标之旅
https://blog.csdn.net/UbuntuTo ... 82301
2.腾讯云 Elasticsearch 新篇章 - 存算分离+读写分离+查询/IO并行化, 助力日志/搜索领域降本增效..
https://blog.csdn.net/cloudbig ... 10882
3.看看ES如何处理数据大小写的问题（需要梯子）
https://medium.com/%40musabdog ... 5ec42
4.使用同义词来增强查询的相关性（需要梯子）
https://medium.com/%40jeevanan ... 92e8b

编辑：kin122
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1750期 (2023-12-05）

1. 一个GPTs的收集、分享站点
https://supertools.therundown.ai/gpts
2. 国外吧友们整理和总结的优秀讲座视频合集
https://news.ycombinator.com/item?id=34591291
3. 网友分享 comfyui flow 的网站，充钱也可以在线运行
https://comfyworkflows.com/

编辑：斯蒂文
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1749期 (2023-12-04）

1、Meta推出音频生成模型Audiobox
https://zhidx.com/news/40531.html
2、iOS微信全文搜索技术优化
https://mp.weixin.qq.com/s/Ph0jykLr5CMF-xFgoJw5UQ
3、通义千问开源全家桶，最小18亿模型端侧都能跑
https://www.jiqizhixin.com/articles/2023-12-01-5
4、Elasticsearch 8.X “图搜图”实战
https://mp.weixin.qq.com/s/4WKUhHS9Ta2NgiRF6C8LFA
5.在NLP与AI加持下的Elasticsearch搜索场景我们应该选择什么样的硬件
https://cloud.tencent.com/deve ... 96488

编辑：yuebancanghai
更多资讯：http://news.searchkit.cn

继续阅读 »

社区日报第1749期 (2023-12-01）

1、借助 Elasticsearch 实现 Kubernetes 日志进行故障排除
https://povilasv.me/troublesho ... arch/

2、将最大内积（Maximum- Inner- Product）引入 Lucene
https://search-labs.elastic.co ... ucene

3、揭秘 ChatGPT：构建 AI 搜索的不同方法
https://search-labs.elastic.co ... earch

编辑：铭毅天下

继续阅读 »

使用极限网关助力 ES 集群无缝升级、迁移上/下云

在工作中大家可能会遇到以下这些场景：

自建 ES 集群需要平滑迁移到 XX 云；
从 XX 云将 ES 集群迁移到自建机房；
ES 集群进行跨版本升级，同时保留回退能力；这些场景往往都还有个共同的需求：迁移过程要保证业务的最小停机时间。 幸运的是，在这三个场景中，我们都能使用极限网关来帮助我们进行更丝滑的迁移或升级。下面，我们以迁移 ES 集群上云为例，介绍下整个工作过程。
自建版本： 5.4.2
云上版本： 5.6.16
Gateway 和 Console 建议用最新版本
迁移架构

通过将应用端流量走网关的方式，请求同步转发给自建 ES，网关记录所有的写入请求，并确保顺序在 XX 云 ES 上重放请求，两侧集群的各种故障都妥善进行了处理，从而实现透明的集群双写，实现安全无缝的数据迁移。业务端如果已经部署在云上，可以使用云上的 SLB 服务来访问网关，确保后端网关的高可用，如果业务端和极限网关还在企业内网，可以使用极限网关自带的 4 层浮动 IP 来确保网关的高可用。

执行步骤

部署 INFINI Gateway

为了保证数据的无缝透明迁移，通过网关来进行双写。
1. 系统调优
2. 安装 INFINI Gateway
3. 修改网关配置在此下载网关双写配置，默认网关会加载配置文件 gateway.yml 。如果要指定其他配置文件使用 -config 选项。配置文件内容较多，下面仅展示必要部分。
```
  #primary
  PRIMARY_ENDPOINT: http://192.168.56.3:7171
  PRIMARY_USERNAME: elastic
  PRIMARY_PASSWORD: password
  PRIMARY_MAX_QPS_PER_NODE: 10000
  PRIMARY_MAX_BYTES_PER_NODE: 104857600 #100MB/s
  PRIMARY_MAX_CONNECTION_PER_NODE: 200
  PRIMARY_DISCOVERY_ENABLED: false
  PRIMARY_DISCOVERY_REFRESH_ENABLED: false
  #backup
  BACKUP_ENDPOINT: http://192.168.56.3:9200
  BACKUP_USERNAME: admin
  BACKUP_PASSWORD: admin
  BACKUP_MAX_QPS_PER_NODE: 10000
  BACKUP_MAX_BYTES_PER_NODE: 104857600 #100MB/s
  BACKUP_MAX_CONNECTION_PER_NODE: 200
  BACKUP_DISCOVERY_ENABLED: false
  BACKUP_DISCOVERY_REFRESH_ENABLED: false
```
  PRIMARY_ENDPOINT：配置主集群地址和端口 PRIMARY_USERNAME、PRIMARY_PASSWORD: 访问主集群的用户信息 BACKUP_ENDPOINT：配置备集群地址和端口 BACKUP_USERNAME、BACKUP_PASSWORD: 访问备集群的用户信息
4. 启动网关启动网关并指定刚刚创建的配置，如下： ./gateway-linux-amd64 -config replication_via-disk.yml.yml
  部署 INFINI Console
  
  为了方便在多个集群之间快速切换，管理网关消费任务、查看队列等。使用 INFINI Console 来进行管理。
5. 下载安装
6. 启动服务 ./console-linux-amd64 -service install ./console-linux-amd64 -service start
7. 注册资源将 ES 集群、极限网关都注册到 Console 中。 - 注册 ES 集群：方便切换集群，执行命令。除了新旧集群外，将网关也在此注册一次，方便验证网关功能。 - 注册 Gateway：管理网关任务、队列。
  测试 INFINI Gateway
  
  为了验证网关是否正常工作，我们通过 INFINI Console 来快速验证一下。首先通过走网关的接口来创建一个索引，并写入一个文档，如下：查看 5.4.2 集群的数据情况，如下：查看集群 5.6.16 的数据情况，如下： 数据一致，说明网关配置都正常，验证结束。
  
  调整网关的消费策略
  
  因为我们需要在全量数据迁移之后，才能进行增量数据的追加，在全量数据迁移完成之前，我们应该暂停增量数据的消费。修改网关配置里面 Pipeline consume-queue_backup-bulk_request_ingestion-to-backup的参数 auto_start为 false，表示不自动启动该任务，具体配置方法如下：修改完配置之后，需要重新启动网关。由于之前已经注册了网关，待全量迁移完成之后，可以通过后台的 Task 管理来进行后续的任务启动、停止，如下：
  
  切换流量
  
  接下来，将业务正常写的流量切换到网关，也就是需要把之前指向 ES 5.4.2 的地址指向网关的地址，如果 5.4.2 集群开启了身份验证，业务端代码同样需要传递身份信息，和 5.4.2 之前的用法保持不变。切换流量到网关之后，用户的请求还是以同步的方式正常访问自建集群，网关记录到的请求会按顺序记录到 MQ 里面，但是消费是暂停状态。如果业务端代码使用的 ES 的 SDK 支持 Sniff，并且业务代码开启了 Sniff，那么应该关闭 Sniff，避免业务端通过 Sniff 直接链接到后端的 ES 节点，所有的流量现在应该都只通过网关来进行访问。
  
  全量数据迁移
  
  在流量迁移到网关之后，我们开始对自建 Elasticsearch 集群的数据进行全量迁移到 XX 云 Elasticsearch 集群。全量迁移已有的数据的方式有很多种：
通过快照的方式进行恢复
使用 INFINI Console 进行数据迁移
增量数据迁移

在全量导入的过程中，可能存在数据的增量修改，不过这部分请求都已经完整记录下来了，我们只需要开启网关的消费任务即可将积压的请求应用到云端的 ES 集群。示例操作如下：通过观察队列是否消费完成来判断增量数据是否做完，如下：

执行数据比对

由于集群内部的数据可能比较多，我们需要进行一个完整的比对才能确保数据的完整性，可以通过 INFINI Console 的数据比对工具来进行。

切换集群

如果验证完之后，两个集群的数据已经完全一致了，可以将程序切换到新集群，或者将网关的配置里面的主备进行互换，仍旧写两个集群，先写云端集群，再写自建集群。双集群在线运行一段时间，待业务完全验证之后，再安全下线老集群，如遇到问题，也可以随时回切到老集群。

小结

通过使用极限网关，自建 ES 集群可以安全无缝的迁移上云，在迁移的过程中，两套集群通过网关进行了解耦，两套集群的版本也可以不一样，在迁移的过程中还能实现版本的无缝升级。 工作流程图

继续阅读 »

在工作中大家可能会遇到以下这些场景：

自建 ES 集群需要平滑迁移到 XX 云；
从 XX 云将 ES 集群迁移到自建机房；
ES 集群进行跨版本升级，同时保留回退能力；这些场景往往都还有个共同的需求：迁移过程要保证业务的最小停机时间。 幸运的是，在这三个场景中，我们都能使用极限网关来帮助我们进行更丝滑的迁移或升级。下面，我们以迁移 ES 集群上云为例，介绍下整个工作过程。
自建版本： 5.4.2
云上版本： 5.6.16
Gateway 和 Console 建议用最新版本
迁移架构

通过将应用端流量走网关的方式，请求同步转发给自建 ES，网关记录所有的写入请求，并确保顺序在 XX 云 ES 上重放请求，两侧集群的各种故障都妥善进行了处理，从而实现透明的集群双写，实现安全无缝的数据迁移。业务端如果已经部署在云上，可以使用云上的 SLB 服务来访问网关，确保后端网关的高可用，如果业务端和极限网关还在企业内网，可以使用极限网关自带的 4 层浮动 IP 来确保网关的高可用。

执行步骤

部署 INFINI Gateway

为了保证数据的无缝透明迁移，通过网关来进行双写。
1. 系统调优
2. 安装 INFINI Gateway
3. 修改网关配置在此下载网关双写配置，默认网关会加载配置文件 gateway.yml 。如果要指定其他配置文件使用 -config 选项。配置文件内容较多，下面仅展示必要部分。
```
  #primary
  PRIMARY_ENDPOINT: http://192.168.56.3:7171
  PRIMARY_USERNAME: elastic
  PRIMARY_PASSWORD: password
  PRIMARY_MAX_QPS_PER_NODE: 10000
  PRIMARY_MAX_BYTES_PER_NODE: 104857600 #100MB/s
  PRIMARY_MAX_CONNECTION_PER_NODE: 200
  PRIMARY_DISCOVERY_ENABLED: false
  PRIMARY_DISCOVERY_REFRESH_ENABLED: false
  #backup
  BACKUP_ENDPOINT: http://192.168.56.3:9200
  BACKUP_USERNAME: admin
  BACKUP_PASSWORD: admin
  BACKUP_MAX_QPS_PER_NODE: 10000
  BACKUP_MAX_BYTES_PER_NODE: 104857600 #100MB/s
  BACKUP_MAX_CONNECTION_PER_NODE: 200
  BACKUP_DISCOVERY_ENABLED: false
  BACKUP_DISCOVERY_REFRESH_ENABLED: false
```
  PRIMARY_ENDPOINT：配置主集群地址和端口 PRIMARY_USERNAME、PRIMARY_PASSWORD: 访问主集群的用户信息 BACKUP_ENDPOINT：配置备集群地址和端口 BACKUP_USERNAME、BACKUP_PASSWORD: 访问备集群的用户信息
4. 启动网关启动网关并指定刚刚创建的配置，如下： ./gateway-linux-amd64 -config replication_via-disk.yml.yml
  部署 INFINI Console
  
  为了方便在多个集群之间快速切换，管理网关消费任务、查看队列等。使用 INFINI Console 来进行管理。
5. 下载安装
6. 启动服务 ./console-linux-amd64 -service install ./console-linux-amd64 -service start
7. 注册资源将 ES 集群、极限网关都注册到 Console 中。 - 注册 ES 集群：方便切换集群，执行命令。除了新旧集群外，将网关也在此注册一次，方便验证网关功能。 - 注册 Gateway：管理网关任务、队列。
  测试 INFINI Gateway
  
  为了验证网关是否正常工作，我们通过 INFINI Console 来快速验证一下。首先通过走网关的接口来创建一个索引，并写入一个文档，如下：查看 5.4.2 集群的数据情况，如下：查看集群 5.6.16 的数据情况，如下： 数据一致，说明网关配置都正常，验证结束。
  
  调整网关的消费策略
  
  因为我们需要在全量数据迁移之后，才能进行增量数据的追加，在全量数据迁移完成之前，我们应该暂停增量数据的消费。修改网关配置里面 Pipeline consume-queue_backup-bulk_request_ingestion-to-backup的参数 auto_start为 false，表示不自动启动该任务，具体配置方法如下：修改完配置之后，需要重新启动网关。由于之前已经注册了网关，待全量迁移完成之后，可以通过后台的 Task 管理来进行后续的任务启动、停止，如下：
  
  切换流量
  
  接下来，将业务正常写的流量切换到网关，也就是需要把之前指向 ES 5.4.2 的地址指向网关的地址，如果 5.4.2 集群开启了身份验证，业务端代码同样需要传递身份信息，和 5.4.2 之前的用法保持不变。切换流量到网关之后，用户的请求还是以同步的方式正常访问自建集群，网关记录到的请求会按顺序记录到 MQ 里面，但是消费是暂停状态。如果业务端代码使用的 ES 的 SDK 支持 Sniff，并且业务代码开启了 Sniff，那么应该关闭 Sniff，避免业务端通过 Sniff 直接链接到后端的 ES 节点，所有的流量现在应该都只通过网关来进行访问。
  
  全量数据迁移
  
  在流量迁移到网关之后，我们开始对自建 Elasticsearch 集群的数据进行全量迁移到 XX 云 Elasticsearch 集群。全量迁移已有的数据的方式有很多种：
通过快照的方式进行恢复
使用 INFINI Console 进行数据迁移
增量数据迁移

在全量导入的过程中，可能存在数据的增量修改，不过这部分请求都已经完整记录下来了，我们只需要开启网关的消费任务即可将积压的请求应用到云端的 ES 集群。示例操作如下：通过观察队列是否消费完成来判断增量数据是否做完，如下：

执行数据比对

由于集群内部的数据可能比较多，我们需要进行一个完整的比对才能确保数据的完整性，可以通过 INFINI Console 的数据比对工具来进行。

切换集群

如果验证完之后，两个集群的数据已经完全一致了，可以将程序切换到新集群，或者将网关的配置里面的主备进行互换，仍旧写两个集群，先写云端集群，再写自建集群。双集群在线运行一段时间，待业务完全验证之后，再安全下线老集群，如遇到问题，也可以随时回切到老集群。

小结

通过使用极限网关，自建 ES 集群可以安全无缝的迁移上云，在迁移的过程中，两套集群通过网关进行了解耦，两套集群的版本也可以不一样，在迁移的过程中还能实现版本的无缝升级。 工作流程图

收起阅读 »

INFINI Labs 产品更新 | 修复 Easysearch 跨集群复制索引同步问题，Gateway 内存异常增长等问题

INFINI Labs 产品又更新啦~，本次更新主要对 Easysearch、Gateway、Console、Agent 等产品功能进行优化和相关 Bug 修复，解决了内存异常增长等问题，以下是详细说明。

INFINI Easysearch v1.6.2

INFINI Easysearch 是一个分布式的近实时搜索与分析引擎，核心引擎基于开源的 Apache Lucene。Easysearch 的目标是提供一个轻量级的 Elasticsearch 可替代版本，并继续完善和支持更多的企业级功能。

Easysearch 本次更新如下：

Bug fix

修复跨集群复制（CCR）不能对自动滚动生成的索引进行同步的问题

Improvements

优化初始化脚本，增加-s/-slient 参数，自动安装。
新增含 jdk/plugins 的 bundle 安装包

INFINI Gateway v1.20.0

INFINI Gateway 是一个面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

增加配置，允许设置 fasthttp client 相关参数

INFINI Console v1.12.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复数据探索 multi fields 字段计算 top values 报错的问题
修复由 Framework Bug 造成连接数不释放、内存异常增长的问题
修复内网模式下静态资源远程加载的问题
修复数据看板数据源配置校验异常的问题

Improvements

优化数据探索计算 top values，使用先采样后，后取 top values
可通过配置参数 http_client.read_buffer_size 设置读取缓存大小，解决开发工具执行命令时，默认缓存太小的问题

INFINI Agent v0.7.1

INFINI Agent 是 INFINI Console 的一个可选探针组件，负责采集和上传集群指标和日志等信息，并可通过 Console 管理。Agent 支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

Features

添加 http processor

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

进一步优化内存占用，降到 50M 以下

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

fix: fix the issue of disk queue was blocked
chore: checkout specify branch before pull

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://www.infinilabs.com

继续阅读 »

INFINI Labs 产品又更新啦~，本次更新主要对 Easysearch、Gateway、Console、Agent 等产品功能进行优化和相关 Bug 修复，解决了内存异常增长等问题，以下是详细说明。

INFINI Easysearch v1.6.2

INFINI Easysearch 是一个分布式的近实时搜索与分析引擎，核心引擎基于开源的 Apache Lucene。Easysearch 的目标是提供一个轻量级的 Elasticsearch 可替代版本，并继续完善和支持更多的企业级功能。

Easysearch 本次更新如下：

Bug fix

修复跨集群复制（CCR）不能对自动滚动生成的索引进行同步的问题

Improvements

优化初始化脚本，增加-s/-slient 参数，自动安装。
新增含 jdk/plugins 的 bundle 安装包

INFINI Gateway v1.20.0

INFINI Gateway 是一个面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

增加配置，允许设置 fasthttp client 相关参数

INFINI Console v1.12.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复数据探索 multi fields 字段计算 top values 报错的问题
修复由 Framework Bug 造成连接数不释放、内存异常增长的问题
修复内网模式下静态资源远程加载的问题
修复数据看板数据源配置校验异常的问题

Improvements

优化数据探索计算 top values，使用先采样后，后取 top values
可通过配置参数 http_client.read_buffer_size 设置读取缓存大小，解决开发工具执行命令时，默认缓存太小的问题

INFINI Agent v0.7.1

INFINI Agent 是 INFINI Console 的一个可选探针组件，负责采集和上传集群指标和日志等信息，并可通过 Console 管理。Agent 支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

Features

添加 http processor

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

进一步优化内存占用，降到 50M 以下

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

fix: fix the issue of disk queue was blocked
chore: checkout specify branch before pull

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://www.infinilabs.com

收起阅读 »

INFINI Easysearch v1.7.0

Features

Bug fix

Improvements

INFINI Console v1.12.0

Features

Bug fix

期待反馈

关于极限科技（INFINI Labs）

INFINI Easysearch v1.7.0

Features

Bug fix

Improvements

INFINI Console v1.12.0

Features

Bug fix

期待反馈

关于极限科技（INFINI Labs）

分享议题

参会提示

分享议题

参会提示

迁移架构

执行步骤

部署 INFINI Gateway

部署 INFINI Console

测试 INFINI Gateway

调整网关的消费策略

切换流量

全量数据迁移

增量数据迁移

执行数据比对

切换集群

小结

迁移架构

执行步骤

部署 INFINI Gateway

部署 INFINI Console

测试 INFINI Gateway

调整网关的消费策略

切换流量

全量数据迁移

增量数据迁移

执行数据比对

切换集群

小结

INFINI Easysearch v1.6.2

Bug fix

Improvements

INFINI Gateway v1.20.0

Bug fix

Improvements

INFINI Console v1.12.0

Bug fix

Improvements

INFINI Agent v0.7.1

Features

Bug fix

Improvements

INFINI Framework

期待反馈

关于极限科技（INFINI Labs）

INFINI Easysearch v1.6.2

Bug fix

Improvements

INFINI Gateway v1.20.0

Bug fix

Improvements

INFINI Console v1.12.0

Bug fix

Improvements

INFINI Agent v0.7.1

Features

Bug fix

Improvements

INFINI Framework

期待反馈

关于极限科技（INFINI Labs）

活动推荐

热门文章