你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

gateway

信创环境下部署 INFINI Gateway：为 Easysearch 构建高性能安全入口

Easysearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 11650 次浏览 • 2026-06-11 17:17 • 来自相关话题

引言

上一篇文章里，我们已经完成了 Easysearch 在信创环境下的部署。搜索服务能跑起来只是第一步，要让它真正用于生产，还需要补上“入口治理”这一环。

例如，下面这些问题在生产环境中非常常见：

如何防止某个应用或用户发出超大查询请求，把 Easysearch 集群拖垮？
如果 Easysearch 某个节点突然宕机，请求能不能自动切换到健康节点，让业务无感知？
如何知道每天有多少次查询、哪些查询慢、哪些请求不合法，有没有办法对请求进行审计？

这些正是 INFINI Gateway（极限网关）擅长解决的问题。本文延续“小白友好”风格，带你完成 Gateway 的安装与验证，为 Easysearch 增加一层高性能、安全、可观测的入口防护。

一、INFINI Gateway 是什么？和 Easysearch 是什么关系？

如果把 Easysearch 比作大型图书馆，那么 INFINI Gateway 就像门口的 “前台总台”。过去读者（应用程序）直接进入书库检索；现在所有请求先经过前台，再转发到书库。这样做的好处很直接：可以缓存热门请求，减少后端压力；可以限制流量，避免集群被突发请求冲垮；还可以记录访问日志，方便审计与分析。

从技术层面讲，INFINI Gateway 的定位如下：

高性能数据网关：面向搜索场景设计，请求先在网关完成处理，再转发到后端 Easysearch 集群。
代理 + 增强：位于客户端与 Easysearch 之间，可在转发链路中叠加限流、缓存加速、请求审计、结果改写等能力。
兼容原生 API：对外接口兼容 Elasticsearch / Easysearch 原生 API，应用只需把连接地址从直连 Easysearch 改为指向网关，无需改业务代码。
轻量易部署：基于 Golang 开发，安装包约 10MB，无额外外部依赖。
信创兼容认证：已通过华为鲲鹏 Kunpeng 920 兼容性认证，并获得 KUNPENG COMPATIBLE 证书。

整个系列的组件关系如下：

应用程序 → INFINI Gateway（流量入口） → Easysearch（数据存储与检索）

有了 Gateway，你就可以更放心地将搜索服务开放给更多应用和用户，而不必过度担心安全与性能失控问题。

二、部署前置条件

1. 信创环境

CPU ：鲲鹏 Kunpeng-920、aarch64
操作系统：统信服务器操作系统A版 V20

2. 确保 Easysearch 已正常运行

Gateway 本身不存储数据，核心职责是代理与增强 Easysearch。因此部署前请先确认 Easysearch 已启动，并且网络可达：

curl -ku admin:你的密码 https://localhost:9200

三、部署步骤

步骤 1：下载 INFINI Gateway

下面脚本会自动下载对应平台的 Gateway 最新版本，并解压到 /opt/gateway：

# 一键下载并安装到 /opt/gateway
curl -sSL http://get.infini.cloud | bash -s -- -p gateway -d /opt/gateway

步骤 2：编写 Gateway 配置文件

Gateway 启动依赖 YAML 配置文件，用来声明监听端口、后端 Easysearch 地址和认证信息。进入安装目录后，找到 gateway.yml 并按实际环境修改：

# 按实际情况填写可访问的 Easysearch 地址
LOGGING_ES_ENDPOINT:https://localhost:9200/

LOGGING_ES_USER:admin

LOGGING_ES_PASS:"你的 Easysearch 密码"

# 按实际情况填写可访问的 Easysearch 地址
PROD_ES_ENDPOINT:https://localhost:9200/

PROD_ES_USER:admin

PROD_ES_PASS:"你的 Easysearch 密码"

# 按需设置 Gateway 对外监听端口
GW_BINDING:"0.0.0.0:8000"

步骤 3：启动 Gateway

进入 Gateway 安装目录，执行下面命令启动程序：

# 进入安装目录
cd /opt/gateway

# 运行程序（gateway-linux-arm64 为可执行文件名）
./gateway-linux-arm64

程序启动后，即可通过配置端口访问 Easysearch 服务。

在前台运行模式下，如需停止 Gateway，按 Ctrl+C 即可。

如果希望将 Gateway 作为后台服务运行，可执行：

# 命令中的 gateway-linux-arm64 为可执行文件名
./gateway-linux-arm64 -service install && ./gateway-linux-arm64 -service start

如需卸载服务，执行以下命令：

./gateway-linux-arm64 -service stop

./gateway-linux-arm64 -service uninstall

步骤 4：验证 Gateway 是否正常工作

通过 Gateway 间接访问 Easysearch，确认转发通路正常：

# 通过 Gateway（8000 端口）访问 Easysearch
curl http://0.0.0.0:8000

# 对比直连 Easysearch 的结果
curl -ku admin:你的密码 https://localhost:9200

两条命令返回的 JSON 结果应基本一致。若都能正常响应，说明 Gateway 已成功接管 Easysearch 的访问入口。

如果你的生产环境需要将搜索服务开放给大量应用和用户，建议将 Gateway 纳入标准部署方案。借助 Gateway，你可以更好地保护后端 Easysearch 集群，并获得限流限速、缓存加速、安全防护、审计日志等增强能力，让整体架构更健壮、更安全、更可观测。

如果在部署过程中遇到问题，欢迎查阅官方文档。祝你部署顺利！

作者：小袁
原文：https://infinilabs.cn/blog/2026/gateway-install-at-xc-platform/

INFINI Labs 产品更新 | Coco AI v0.9 与 Easysearch v2.0 全新功能上线，全面支持 GitLab 合并请求（MR）自动 AI Review

资讯动态 • INFINI Labs 小助手发表了文章 • 0 个评论 • 10579 次浏览 • 2025-11-24 00:24 • 来自相关话题

INFINI Labs 产品更新发布！此次更新主要包括：Coco AI v0.9 全面支持 GitLab 合并请求（MR）自动 AI Review，并重构为插件流水线架构，新增 Neo4j、MongoDB 等 10+ 数据源连接器，开启“AI+开发”协同新范式；Easysearch v2.0 正式发布，内置轻量级管理 UI，无需依赖 Kibana，实现集群“开箱即管”，Lucene 升级至 9.12.2，性能全面提升；INFINI Console、Gateway、Agent、Loadgen v1.30 统一基于 Framework v1.3 升级，全面支持 Easysearch 2.0 与 OpenSearch 3.x，新增百分比聚合、子目录代理等关键能力。详情见 Release Notes。

Coco AI v0.9

Coco AI 是一款完全开源、跨平台的企业级智能搜索与助手系统，专为现代企业打造。它通过统一搜索入口，连接企业内外部的异构数据源，融合大模型能力，帮助团队高效访问知识，智能决策协作。

Coco AI 本次详细更新记录如下：

Coco AI 客户端 v0.9

🚀 功能特性 (Features)

feat: 支持通过快捷键切换分组 #911
feat: 支持从设置页面打开日志文件夹
feat: 支持使用 home 和 end 键移动光标
feat: 支持使用 page up 和 page down 键移动选中条
feat: 规范化多级菜单的标签结构
feat: 当父插件类型为 Extension 时，搜索父插件可以搜到子插件
feat: 支持使用 modifier key 和回车对话 AI 助手
feat: 允许在光标位于开头时返回
feat(插件兼容性): 插件描述文件添加 minimum_coco_version 字段进行版本检查
feat: 实现紧凑窗口模式
feat: 实现设置项搜索延迟和本地搜索结果权重
feat: 添加主窗口透明度设置
feat: 添加从默认模式回答紧凑模式的延迟设置

✈️ 改进优化 (Improvements)

refactor: 优化搜索结果的排序逻辑 #910
style: 为图片添加深色投影 #912
chore: 为 Web 组件添加跨域配置 #921
refactor: 若 AXUIElementSetAttributeValue() 失败则进行重试 #924
refactor(calculator): 若表达式为 "num => num" 格式则跳过计算 #929
chore: 使用自定义日志目录 #930
chore: 将 tauri_nspanel 升级至 v2.1 #933
refactor: show_coco/hide_coco 现已在 macOS 上改用 NSPanel 的相关方法 #933
refactor: 将 convert_pages() 流程封装为函数 #934
refactor(post-search): 从每个查询源至少收集 2 份文档 #948
refactor: custom_version_comparator() 现已支持语义化版本比较 #941
chore: 让主窗口垂直居中 #959
refactor(view extension): 通过本地 HTTP 服务器加载 HTML/资源文件 #973

🐛 问题修复(Bug Fixes)

fix: 修复服务列表自动更新的问题 #913
ix: 修复聊天内容重复的问题 #916
fix: 修复固定窗口（Pinned Window）快捷键失效的问题 #917
fix: 修复从另一显示器操作焦点窗口时，窗口管理扩展失效的问题 #919
fix(窗口管理插件): 修复“下一个/上一个桌面”功能失效的问题 #926
fix: 修复页面频繁闪烁的问题 #935
fix(view extension): 修复通过快捷键打开扩展时搜索栏 UI 显示异常的问题 #938
fix: 修复全选文本后无法删除的问题 #943
fix: 修复在聊天和搜索页面之间切换时的抖动问题 #955
fix: 修复重复显示登录成功提示的问题 #977
fix: 修复 Quick AI 无法继续对话的问题 #979

Coco App 相关截图：

Coco AI 服务端 v0.9

💥 重大变更(Breaking Changes)

refactor: 将连接器重构为基于流水线（Pipeline）模式 (#545) #545
refactor: 重新实现安全功能；需重新运行设置程序

🚀 功能特性 (Features)

feat: 新增 Neo4j 连接器 #539
feat: 新增内置商店 #551
feat: 基于 RBAC 的安全机制
feat: 用户级数据所有权与共享功能
feat: 管理界面增加权限校验
feat: 新增路由权限验证
feat: 新增用户实体卡片
feat: 文档管理增加视图功能
feat: 新增 Webhooks 管理界面 (#558)
feat: 新增 GitLab 合并事件的 Webhook 处理器
feat: 集成扩展商店
feat: 支持编辑连接器处理器配置
feat: 支持配置 Base Path 以自定义服务端点
feat: 名称字段增加拼音支持
feat: 新增 MongoDB 连接器

🐛 问题修复(Bug Fixes)

fix: 修复切换扩展类型后重置搜索关键词的问题
fix: 修复全屏小部件的相关问题

✈️ 改进优化 (Improvements)

refactor: 为深色模式添加悬停背景效果
chore: 修复文档搜索功能
chore: 格式化日期
refactor: 更新初始值
chore: 修复数据源名称缺失的问题
chore: 安装完成后隐藏弹窗
chore: 基于框架变更进行重构
chore: 为支持深度思考（DeepThink）获取更多文档 #577
chore: 启用搜索后将首页更改为搜索页 #541
chore: 更新搜索 API 以支持查询 DSL #550
chore: 默认按创建时间排序
chore: 调整多语言配置
chore: 用户表单增加确认密码字段
chore: 调整连接器类型
chore: 调整连接器 OAuth 重定向设置
refactor: 为集成功能进行重构
refactor: 移除集成配置中的 Token
chore: 编辑用户时禁用邮箱字段
chore: 调整搜索设置

Coco Server 相关截图：

Easysearch v2.0

INFINI Easysearch 是一个分布式的搜索型数据库，实现非结构化数据检索、全文检索、向量检索、地理位置信息查询、组合索引查询、多语种支持、聚合分析等。Easysearch 可以完美替代 Elasticsearch，同时添加和完善多项企业级功能。Easysearch 助您拥有简洁、高效、易用的搜索体验。

Easysearch 本次更新如下：

💥 重大变更(Breaking Changes)

正式发布 Easysearch 2.0 版本，底层 Lucene 更新到 9.12.2
新增 ui 插件，为 Easysearch 提供了轻量级界面化管理功能，不再依赖第三方对集群进行管理，真正做到开箱即用

🚀 功能特性 (Features)

兼容 1.15.x 版本的索引，可无缝升级
新增 UI 插件，涵盖从集群，节点，索引，到分片等不同维度的监控和管理功能
支持关闭 security 进入 UI

✈️ 改进优化 (Improvements)

range 查询，按数字类型字段排序，相比旧版本效率大幅提升

Easysearch UI 相关截图：

Console v1.30

INFINI Console 是一款开源的非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 本次详细更新记录如下：

🚀 功能特性 (Features)

feat: 支持百分比聚合
feat: 为初始化管理员用户增加密码强度校验 (#250)
feat: 支持 Nginx 代理下的子目录路径 (#243)

🐛 问题修复(Bug Fixes)

fix: 修复了索引映射 (mapping) 在滚动查询 (scroll) 后不正确的问题 (#248)
fix: 修复索引 mapping 在滚动操作之后不对的问题
fix: 修复集群监控设置显示错误

✈️ 改进优化 (Improvements)

chore: 删除集群后减少 Agent 上报异常错误日志输出 (#258)
此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Console 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Console 受益。

Gateway v1.30

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

🚀 功能特性 (Features)

feat(rewrite_to_bulk)：使文档更新兼容 Elasticsearch 6.x (#112)

🐛 问题修复(Bug Fixes)

fix: 修复心跳连接的潜在泄漏问题 (#107)

✈️ 改进优化 (Improvements)

改进 ReverseProxy 的锁机制和节点发现逻辑 (#111)
此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Gateway 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Gateway 受益。

Agent v1.30

INFINI Agent 负责采集和上传 Elasticsearch, Easysearch, Opensearch 集群的日志和指标信息，通过 INFINI Console 管理，支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

🚀 功能特性 (Features)

在 Kubernetes 环境下通过环境变量 http.port 探测 Easysearch 的 HTTP 端口

✈️ 改进优化 (Improvements)

此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Agent 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Agent 受益。

Loadgen v1.30

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

✈️ 改进优化 (Improvements)

此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Loadgen 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Loadgen 受益。

Framework 1.3.0

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

🚀 功能特性 (Features)

feat: add delete by query v2 #194
feat: support aggregation queries in orm
feat: add support for query_string query
feat: allow to read http request body multi-times #212
feat: add support for Elasticsearch cat allocation API
feat: support custom write operation type for indexing_merge processor
feat: add util to parse time with local timezone #217
feat: add PKCS#12 certificate support for http client config
feat: add security module, with rbac,sharing,oauth client etc.
feat: add entity_card module
feat: add abstract layer for user or teams search
feat: add util to normalize folder path
feat: add some string utils
feat: allow force update all mappings for existing indices
feat: add several http filters
feat: add util to execute http requests via curl

🐛 问题修复 (Bug Fixes)

fix: localhost/127.0.0.1 with noproxy #185
fix: cluster metadata lost #200
fix: fix security permission cache
fix: fix incorrect queue capacity check

✈️ 改进 (Improvements)

chore: less logging for session store change #180
refactor: initialize index schema using index template
chore: add generate secure string util func #183
chore: add validate secure func #184
refactor: refactoring security structs #191
refactor: refactoring schema init logic, disable index based template #188
chore: use safe special chars #190
chore: reduce log with agent #193
chore: add util to register http handler #206
chore: allow access application settings for ui #209
refactor: refactoring query string parser #216
chore: update default fuzziness to 3 #215
chore: avoid using same session name for mulit instances #221
refactor: refactoring pipeline #222
chore: enhance bulk indexing - stricter offset validation and improved error handling #224
refactor: refactoring http utils #226
refactor: refactoring search response, add score support
refactor: refactoring ORM module, add generic security hooks
refactor: add boolean query to orm query builder
refactor: refactoring access_token, simplify login info
refactor: move RegisterAllowOriginFunc to core

更多详情请查看以下各产品的 Release Notes 或联系我们的技术支持团队！

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://infinilabs.cn

【搜索客社区日报】第2119期 (2025-09-22）

社区日报 • Muses 发表了文章 • 0 个评论 • 12448 次浏览 • 2025-09-22 13:44 • 来自相关话题

如何使用极限网关实现 Elasticsearch 集群迁移至 Easysearch

Elasticsearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 21060 次浏览 • 2025-09-21 14:50 • 来自相关话题

之前有博客介绍过通过 Reindex 的方法将 Elasticsearch 的数据迁移到 Easysearch 集群，今天再介绍一个方法，通过极限网关（INFINI Gateway）来进行数据迁移。

测试环境

软件	版本
Easysearch	1.12.0
Elasticsearch	7.17.29
INFINI Gateway	1.29.2

迁移步骤

选定要迁移的索引
在目标集群建立索引的 mapping 和 setting
准备 INFINI Gateway 迁移配置
运行 INFINI Gateway 进行数据迁移

迁移实战

选定要迁移的索引

在 Elasticsearch 集群中选择目标索引：infinilabs 和 test1，没错，我们一次可以迁移多个。

在 Easysearch 集群使用源索引的 setting 和 mapping 建立目标索引。（略）
INFINI Gateway 迁移配置准备

去 github 下载配置，修改下面的连接集群的部分

  1 env:
  2   LR_GATEWAY_API_HOST: 127.0.0.1:2900
  3   SRC_ELASTICSEARCH_ENDPOINT: http://127.0.0.1:9200
  4   DST_ELASTICSEARCH_ENDPOINT: http://127.0.0.1:9201
  5 path.data: data
  6 path.logs: log
  7 progress_bar.enabled: true
  8 configs.auto_reload: true
  9
 10 api:
 11   enabled: true
 12   network:
 13     binding: $[[env.LR_GATEWAY_API_HOST]]
 14
 15 elasticsearch:
 16   - name: source
 17     enabled: true
 18     endpoint: $[[env.SRC_ELASTICSEARCH_ENDPOINT]]
 19     basic_auth:
 20       username: elastic
 21       password: goodgoodstudy
 22
 23   - name: target
 24     enabled: true
 25     endpoint: $[[env.DST_ELASTICSEARCH_ENDPOINT]]
 26     basic_auth:
 27       username: admin
 28       password: 14da41c79ad2d744b90c

pipeline 部分修改要迁移的索引名称，我们迁移 infinilabs 和 test1 两个索引。

 31 pipeline:
 32   - name: source_scroll
 33     auto_start: true
 34     keep_running: false
 35     processor:
 36       - es_scroll:
 37           slice_size: 1
 38           batch_size: 5000
 39           indices: "infinilabs,test1"
 40           elasticsearch: source
 41           output_queue: source_index_dump
 42           partition_size: 1
 43           scroll_time: "5m"

迁移数据

./gateway-mac-arm64

#如果你保存的配置文件名称不叫 gateway.yml，则需要加参数 -config 文件名

数据导入完成后，网关 ctrl+c 退出。

至此，数据迁移就完成了。下一篇我们来介绍 INFINI Gateway 的数据比对功能。

有任何问题，欢迎加我微信沟通。

关于极限网关（INFINI Gateway）

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway，可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

官网文档：https://docs.infinilabs.com/gateway
开源地址：https://github.com/infinilabs/gateway

ES 调优帖：Gateway 批量写入性能优化实践

Elasticsearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 18905 次浏览 • 2025-08-06 17:32 • 来自相关话题

背景：bulk 优化的应用

在 ES 的写入优化里，bulk 操作被广泛地用于批量处理数据。bulk 操作允许用户一次提交多个数据操作，如索引、更新、删除等，从而提高数据处理效率。bulk 操作的实现原理是，将数据操作请求打包成 HTTP 请求，并批量提交给 Elasticsearch 服务器。这样，Elasticsearch 服务器就可以一次处理多个数据操作，从而提高处理效率。

这种优化的核心价值在于减少了网络往返的次数和连接建立的开销。每一次单独的写入操作都需要经历完整的请求-响应周期，而批量写入则是将多个操作打包在一起，用一次通信完成原本需要多次交互的工作。这不仅仅节省了时间，更重要的是释放了系统资源，让服务器能够专注于真正的数据处理，而不是频繁的协议握手和状态维护。

这样的批量请求的确是可以优化写入请求的效率，让 ES 集群获得更多的资源去做写入请求的集中处理。但是除了客户端与 ES 集群的通讯效率优化，还有其他中间过程能优化么？

Gateway 的优化点

bulk 的优化理念是将日常零散的写入需求做集中化的处理，尽量减低日常请求的损耗，完成资源最大化的利用。简而言之就是“好钢用在刀刃上”。

但是 ES 在收到 bulk 写入请求后，也是需要协调节点根据文档的 id 计算所属的分片来将数据分发到对应的数据节点的。这个过程也是有一定损耗的，如果 bulk 请求中数据分布的很散，每个分片都需要进行写入，原本 bulk 集中写入的需求优势则还是没有得到最理想化的提升。

gateway 的写入加速则对 bulk 的优化理念的最大化补全。

gateway 可以本地计算每个索引文档对应后端 Elasticsearch 集群的目标存放位置，从而能够精准的进行写入请求定位。

在一批 bulk 请求中，可能存在多个后端节点的数据，bulk_reshuffle 过滤器用来将正常的 bulk 请求打散，按照目标节点或者分片进行拆分重新组装，避免 Elasticsearch 节点收到请求之后再次进行请求分发，从而降低 Elasticsearch 集群间的流量和负载，也能避免单个节点成为热点瓶颈，确保各个数据节点的处理均衡，从而提升集群总体的索引吞吐能力。

整理的优化思路如下图：

优化实践

那我们来实践一下，看看 gateway 能提升多少的写入。

这里我们分 2 个测试场景：

基础集中写入测试，不带文档 id，直接批量写入。这个场景更像是日志或者监控数据采集的场景。
带文档 id 的写入测试，更偏向搜索场景或者大数据批同步的场景。

2 个场景都进行直接写入 ES 和 gateway 转发 ES 的效率比对。

测试材料除了需要备一个网关和一套 es 外，其余的内容如下：

测试索引 mapping 一致，名称区分：

PUT gateway_bulk_test
{
  "settings": {
    "number_of_shards": 6,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "timestamp": {
        "type": "date",
        "format": "strict_date_optional_time"
      },
      "field1": {
        "type": "keyword"
      },
      "field2": {
        "type": "keyword"
      },
      "field3": {
        "type": "keyword"
      },
      "field4": {
        "type": "integer"
      },
      "field5": {
        "type": "keyword"
      },
      "field6": {
        "type": "float"
      }
    }
  }
}

PUT bulk_test
{
  "settings": {
    "number_of_shards": 6,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "timestamp": {
        "type": "date",
        "format": "strict_date_optional_time"
      },
      "field1": {
        "type": "keyword"
      },
      "field2": {
        "type": "keyword"
      },
      "field3": {
        "type": "keyword"
      },
      "field4": {
        "type": "integer"
      },
      "field5": {
        "type": "keyword"
      },
      "field6": {
        "type": "float"
      }
    }
  }
}

gateway 的配置文件如下：

path.data: data
path.logs: log

entry:
  - name: my_es_entry
    enabled: true
    router: my_router
    max_concurrency: 200000
    network:
      binding: 0.0.0.0:8000

flow:
  - name: async_bulk
    filter:
      - bulk_reshuffle:
          when:
            contains:
              _ctx.request.path: /_bulk
          elasticsearch: prod
          level: node
          partition_size: 1
          fix_null_id: true
      - elasticsearch:
          elasticsearch: prod #elasticsearch configure reference name
          max_connection_per_node: 1000 #max tcp connection to upstream, default for all nodes
          max_response_size: -1 #default for all nodes
          balancer: weight
          refresh: # refresh upstream nodes list, need to enable this feature to use elasticsearch nodes auto discovery
            enabled: true
            interval: 60s
          filter:
            roles:
              exclude:
                - master

router:
  - name: my_router
    default_flow: async_bulk

elasticsearch:
  - name: prod
    enabled: true
    endpoints:
      - https://127.0.0.1:9221
      - https://127.0.0.1:9222
      - https://127.0.0.1:9223
    basic_auth:
      username: admin
      password: admin

pipeline:
  - name: bulk_request_ingest
    auto_start: true
    keep_running: true
    retry_delay_in_ms: 1000
    processor:
      - bulk_indexing:
          max_connection_per_node: 100
          num_of_slices: 3
          max_worker_size: 30
          idle_timeout_in_seconds: 10
          bulk:
            compress: false
            batch_size_in_mb: 10
            batch_size_in_docs: 10000
          consumer:
            fetch_max_messages: 100
          queue_selector:
            labels:
              type: bulk_reshuffle

测试脚本如下：

#!/usr/bin/env python3
"""
ES Bulk写入性能测试脚本

"""

import hashlib
import json
import random
import string
import time
from typing import List, Dict, Any

import requests
from concurrent.futures import ThreadPoolExecutor
from datetime import datetime
import urllib3

# 禁用SSL警告
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

class ESBulkTester:
    def __init__(self):
        # 配置变量 - 可修改
        self.es_configs = [
            {
                "name": "ES直连",
                "url": "https://127.0.0.1:9221",
                "index": "bulk_test",
                "username": "admin",  # 修改为实际用户名
                "password": "admin",  # 修改为实际密码
                "verify_ssl": False  # HTTPS需要SSL验证
            },
            {
                "name": "Gateway代理",
                "url": "http://localhost:8000",
                "index": "gateway_bulk_test",
                "username": None,  # 无需认证
                "password": None,
                "verify_ssl": False
            }
        ]
        self.batch_size = 10000  # 每次bulk写入条数
        self.log_interval = 100000  # 每多少次bulk写入输出日志

        # ID生成规则配置 - 前2位后5位
        self.id_prefix_start = 1
        self.id_prefix_end = 999      # 前3位: 01-999
        self.id_suffix_start = 1
        self.id_suffix_end = 9999   # 后4位: 0001-9999

        # 当前ID计数器
        self.current_prefix = self.id_prefix_start
        self.current_suffix = self.id_suffix_start

    def generate_id(self) -> str:
        """生成固定规则的ID - 前2位后5位"""
        id_str = f"{self.current_prefix:02d}{self.current_suffix:05d}"

        # 更新计数器
        self.current_suffix += 1
        if self.current_suffix > self.id_suffix_end:
            self.current_suffix = self.id_suffix_start
            self.current_prefix += 1
            if self.current_prefix > self.id_prefix_end:
                self.current_prefix = self.id_prefix_start

        return id_str

    def generate_random_hash(self, length: int = 32) -> str:
        """生成随机hash值"""
        random_string = ''.join(random.choices(string.ascii_letters + string.digits, k=length))
        return hashlib.md5(random_string.encode()).hexdigest()

    def generate_document(self) -> Dict[str, Any]:
        """生成随机文档内容"""
        return {
            "timestamp": datetime.now().isoformat(),
            "field1": self.generate_random_hash(),
            "field2": self.generate_random_hash(),
            "field3": self.generate_random_hash(),
            "field4": random.randint(1, 1000),
            "field5": random.choice(["A", "B", "C", "D"]),
            "field6": random.uniform(0.1, 100.0)
        }

    def create_bulk_payload(self, index_name: str) -> str:
        """创建bulk写入payload"""
        bulk_data = []

        for _ in range(self.batch_size):
            #doc_id = self.generate_id()
            doc = self.generate_document()

            # 添加index操作
            bulk_data.append(json.dumps({
                "index": {
                    "_index": index_name,
            #        "_id": doc_id
                }
            }))
            bulk_data.append(json.dumps(doc))

        return "\n".join(bulk_data) + "\n"

    def bulk_index(self, config: Dict[str, Any], payload: str) -> bool:
        """执行bulk写入"""
        url = f"{config['url']}/_bulk"
        headers = {
            "Content-Type": "application/x-ndjson"
        }

        # 设置认证信息
        auth = None
        if config.get('username') and config.get('password'):
            auth = (config['username'], config['password'])

        try:
            response = requests.post(
                url,
                data=payload,
                headers=headers,
                auth=auth,
                verify=config.get('verify_ssl', True),
                timeout=30
            )
            return response.status_code == 200
        except Exception as e:
            print(f"Bulk写入失败: {e}")
            return False

    def refresh_index(self, config: Dict[str, Any]) -> bool:
        """刷新索引"""
        url = f"{config['url']}/{config['index']}/_refresh"

        # 设置认证信息
        auth = None
        if config.get('username') and config.get('password'):
            auth = (config['username'], config['password'])

        try:
            response = requests.post(
                url,
                auth=auth,
                verify=config.get('verify_ssl', True),
                timeout=10
            )
            success = response.status_code == 200
            print(f"索引刷新{'成功' if success else '失败'}: {config['index']}")
            return success
        except Exception as e:
            print(f"索引刷新失败: {e}")
            return False

    def run_test(self, config: Dict[str, Any], round_num: int, total_iterations: int = 100000):
        """运行性能测试"""
        test_name = f"{config['name']}-第{round_num}轮"
        print(f"\n开始测试: {test_name}")
        print(f"ES地址: {config['url']}")
        print(f"索引名称: {config['index']}")
        print(f"认证: {'是' if config.get('username') else '否'}")
        print(f"每次bulk写入: {self.batch_size}条")
        print(f"总计划写入: {total_iterations * self.batch_size}条")
        print("-" * 50)

        start_time = time.time()
        success_count = 0
        error_count = 0

        for i in range(1, total_iterations + 1):
            payload = self.create_bulk_payload(config['index'])

            if self.bulk_index(config, payload):
                success_count += 1
            else:
                error_count += 1

            # 每N次输出日志
            if i % self.log_interval == 0:
                elapsed_time = time.time() - start_time
                rate = i / elapsed_time if elapsed_time > 0 else 0
                print(f"已完成 {i:,} 次bulk写入, 耗时: {elapsed_time:.2f}秒, 速率: {rate:.2f} bulk/秒")

        end_time = time.time()
        total_time = end_time - start_time
        total_docs = total_iterations * self.batch_size

        print(f"\n{test_name} 测试完成!")
        print(f"总耗时: {total_time:.2f}秒")
        print(f"成功bulk写入: {success_count:,}次")
        print(f"失败bulk写入: {error_count:,}次")
        print(f"总文档数: {total_docs:,}条")
        print(f"平均速率: {success_count/total_time:.2f} bulk/秒")
        print(f"文档写入速率: {total_docs/total_time:.2f} docs/秒")
        print("=" * 60)

        return {
            "test_name": test_name,
            "config_name": config['name'],
            "round": round_num,
            "es_url": config['url'],
            "index": config['index'],
            "total_time": total_time,
            "success_count": success_count,
            "error_count": error_count,
            "total_docs": total_docs,
            "bulk_rate": success_count/total_time,
            "doc_rate": total_docs/total_time
        }

    def run_comparison_test(self, total_iterations: int = 10000):
        """运行双地址对比测试"""
        print("ES Bulk写入性能测试开始")
        print(f"测试时间: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
        print("=" * 60)

        results = []
        rounds = 2  # 每个地址测试2轮

        # 循环测试所有配置
        for config in self.es_configs:
            print(f"\n开始测试配置: {config['name']}")
            print("*" * 40)

            for round_num in range(1, rounds + 1):
                # 运行测试
                result = self.run_test(config, round_num, total_iterations)
                results.append(result)

                # 每轮结束后刷新索引
                print(f"\n第{round_num}轮测试完成，执行索引刷新...")
                self.refresh_index(config)

                # 重置ID计数器
                if round_num == 1:
                    # 第1轮：使用初始ID范围（新增数据）
                    print("第1轮：新增数据模式")
                else:
                    # 第2轮：重复使用相同ID（更新数据模式）
                    print("第2轮：数据更新模式，复用第1轮ID")
                    self.current_prefix = self.id_prefix_start
                    self.current_suffix = self.id_suffix_start

                print(f"{config['name']} 第{round_num}轮测试结束\n")

        # 输出对比结果
        print("\n性能对比结果:")
        print("=" * 80)

        # 按配置分组显示结果
        config_results = {}
        for result in results:
            config_name = result['config_name']
            if config_name not in config_results:
                config_results[config_name] = []
            config_results[config_name].append(result)

        for config_name, rounds_data in config_results.items():
            print(f"\n{config_name}:")
            total_time = 0
            total_bulk_rate = 0
            total_doc_rate = 0

            for round_data in rounds_data:
                print(f"  第{round_data['round']}轮:")
                print(f"    耗时: {round_data['total_time']:.2f}秒")
                print(f"    Bulk速率: {round_data['bulk_rate']:.2f} bulk/秒")
                print(f"    文档速率: {round_data['doc_rate']:.2f} docs/秒")
                print(f"    成功率: {round_data['success_count']/(round_data['success_count']+round_data['error_count'])*100:.2f}%")

                total_time += round_data['total_time']
                total_bulk_rate += round_data['bulk_rate']
                total_doc_rate += round_data['doc_rate']

            avg_bulk_rate = total_bulk_rate / len(rounds_data)
            avg_doc_rate = total_doc_rate / len(rounds_data)

            print(f"  平均性能:")
            print(f"    总耗时: {total_time:.2f}秒")
            print(f"    平均Bulk速率: {avg_bulk_rate:.2f} bulk/秒")
            print(f"    平均文档速率: {avg_doc_rate:.2f} docs/秒")

        # 整体对比
        if len(config_results) >= 2:
            config_names = list(config_results.keys())
            config1_avg = sum([r['bulk_rate'] for r in config_results[config_names[0]]]) / len(config_results[config_names[0]])
            config2_avg = sum([r['bulk_rate'] for r in config_results[config_names[1]]]) / len(config_results[config_names[1]])

            if config1_avg > config2_avg:
                faster = config_names[0]
                rate_diff = config1_avg - config2_avg
            else:
                faster = config_names[1]
                rate_diff = config2_avg - config1_avg

            print(f"\n整体性能对比:")
            print(f"{faster} 平均性能更好，bulk速率高 {rate_diff:.2f} bulk/秒")
            print(f"性能提升: {(rate_diff/min(config1_avg, config2_avg)*100):.1f}%")

def main():
    """主函数"""
    tester = ESBulkTester()

    # 运行测试（每次bulk 1万条，300次bulk = 300万条文档）
    tester.run_comparison_test(total_iterations=300)

if __name__ == "__main__":
    main()

1. 日志场景：不带 id 写入

测试条件：

bulk 写入数据不带文档 id
每批次 bulk 10000 条数据，总共写入 30w 数据

这里把

反馈结果：

性能对比结果:
================================================================================

ES直连:
  第1轮:
    耗时: 152.29秒
    Bulk速率: 1.97 bulk/秒
    文档速率: 19699.59 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 152.29秒
    平均Bulk速率: 1.97 bulk/秒
    平均文档速率: 19699.59 docs/秒

Gateway代理:
  第1轮:
    耗时: 115.63秒
    Bulk速率: 2.59 bulk/秒
    文档速率: 25944.35 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 115.63秒
    平均Bulk速率: 2.59 bulk/秒
    平均文档速率: 25944.35 docs/秒

整体性能对比:
Gateway代理 平均性能更好，bulk速率高 0.62 bulk/秒
性能提升: 31.7%

2. 业务场景：带文档 id 的写入

测试条件：

bulk 写入数据带有文档 id，两次测试写入的文档 id 生成规则一致且重复。
每批次 bulk 10000 条数据，总共写入 30w 数据

这里把 py 脚本中第 99 行和第 107 行的注释打开。

反馈结果：

性能对比结果:
================================================================================

ES直连:
  第1轮:
    耗时: 155.30秒
    Bulk速率: 1.93 bulk/秒
    文档速率: 19317.39 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 155.30秒
    平均Bulk速率: 1.93 bulk/秒
    平均文档速率: 19317.39 docs/秒

Gateway代理:
  第1轮:
    耗时: 116.73秒
    Bulk速率: 2.57 bulk/秒
    文档速率: 25700.06 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 116.73秒
    平均Bulk速率: 2.57 bulk/秒
    平均文档速率: 25700.06 docs/秒

整体性能对比:
Gateway代理 平均性能更好，bulk速率高 0.64 bulk/秒
性能提升: 33.0%

小结

不管是日志场景还是业务价值更重要的大数据或者搜索数据同步场景， gateway 的写入加速都能平稳的节省 25%-30% 的写入耗时。

关于极限网关（INFINI Gateway）

官网文档：https://docs.infinilabs.com/gateway
开源地址：https://github.com/infinilabs/gateway

作者：金多安，极限科技（INFINI Labs）搜索运维专家，Elastic 认证专家，搜索客社区日报责任编辑。一直从事与搜索运维相关的工作，日常会去挖掘 ES / Lucene 方向的搜索技术原理，保持搜索相关技术发展的关注。
原文：https://infinilabs.cn/blog/2025/gateway-bulk-write-performance-optimization/

INFINI Labs 产品更新 | Coco AI – 增强 AI 搜索、API 管理与性能优化等

资讯动态 • INFINI Labs 小助手发表了文章 • 0 个评论 • 4375 次浏览 • 2025-03-15 18:21 • 来自相关话题

INFINI Labs 产品更新发布！此次更新涵盖 Coco AI 、Easysearch 等产品多项重要升级，重点提升 AI 搜索能力、易用性及企业级优化。

Coco AI v0.2 作为开源、跨平台的 AI 搜索工具，新增 APP 自动更新提示、API Token 管理、文档处理优化等功能。
INFINI Easysearch v1.11.1 集成 AI 向量搜索，优化查询聚合能力。
INFINI Console、Gateway、Agent、Loadgen、Framework 关键问题修复，优化 WebSocket 处理与整体用户体验。
Coco AI Server 增强 WebSocket 会话处理、支持 RAG 会话和动态配置，并新增图形化管理界面。

Coco AI v0.2

Coco AI 是一个完全开源、跨平台的统一 AI 搜索与效率工具，能够连接并搜索多种数据源，包括应用程序、文件、谷歌网盘、Notion、语雀、Hugo 等本地与云端数据。通过接入 DeepSeek 等大模型，Coco AI 实现了智能化的个人知识库管理，注重隐私，支持私有部署，帮助用户快速、智能地访问信息。

Coco AI 本次详细更新记录如下：

Coco AI 客户端 v0.2.1

功能更新

支持 APP 应用内更新提示并可自动更新

问题修复

修复融合搜索包含已禁用服务器的问题
修复版本类型不正确：应为字符串而不是 u32
修复聊天推送结束的判断类型不准确问题

优化改进

重构了聊天组件
添加服务链接展示
优化了聊天滚动效果和聊天数据渲染效果
设置聊天窗口最小宽度 & 移除输入框背景
移除废弃的选中功能 & 添加选择隐藏 APP 功能
Websocket 超时增加到 2 分钟

Coco AI 服务端 v0.2.2

功能更新

新增图形化管理界面
新增数据源下文档创建 API
新增文件上传相关 API
新增 API TOKEN 管理相关 API
数据源同步支持动态配置时间间隔
支持动态更新服务端设置
支持动态更新大模型相关设置
新增 RAG 聊天会话处理
新增联网搜索能力
支持对接 Deepseek 大模型
新增文档预处理 Processor

问题修复

修复 Google Drive Connector 缺少文件报错

优化改进

优化聊天会话功能
优化 Websocket 会话管理
优化登录退出接口
保存 Notion 其它内容到 Payload 字段
完善后台任务退出机制
优化默认索引模版和查询模版

INFINI Easysearch v1.11.1

Easysearch 本次更新如下：

功能更新

新增 AI 模块，集成 Ollama embedding API，支持文本向量化

问题修复

修复 DateRange 聚合在 Rollup 查询中无法正确合并的问题

优化改进

针对用户使用体验进行了多项改进，包括：

弃用 KNN 模块中的 index.knn 配置项，（此配置项和其他功能经常发生冲突）简化配置逻辑，该配置项将在后续版本中移除
将 KNN 搜索功能从插件形式集成为内置功能，无需额外安装即可使用
将跨集群复制（CCR）功能从插件形式集成为内置功能，开箱即用
优化索引配置更新验证：增加非动态配置项的值比对，避免误报

INFINI Console v1.29.1

Console 在线体验：

http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

问题修复

修复 agentless 模式下计算索引级别实时 QPS 不准确的问题

INFINI Gateway v1.29.1

Gateway 本次更新如下：

优化改进

同步更新 Framework v1.1.4 优化了一些已知问题

INFINI Agent v1.29.1

Agent 本次更新如下：

优化改进

同步更新 Framework v1.1.4 优化了一些已知问题

INFINI Loadgen v1.29.1

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

优化改进

同步更新 Framework v1.1.4 优化了一些已知问题

INFINI Framework v1.1.4

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

功能更新

添加配置选项，以在 WebSocket 连接期间禁用回显消息
允许在 WebSocket 连接/断开时注册回调函数
为 API 添加可选的登录验证配置

优化改进

停止任务后取消任务
回调发生错误时关闭 WebSocket 连接

更多详情请查看以下详细的 Release Notes 或联系我们的技术支持团队！

期待反馈

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

官网：https://infinilabs.cn

INFINI Labs 产品更新 | Console/Gateway/Agent 等产品开源发布首个版本

资讯动态 • INFINI Labs 小助手发表了文章 • 1 个评论 • 4579 次浏览 • 2024-12-27 16:11 • 来自相关话题

INFINI Labs 产品又更新啦~，包括 Easysearch v1.9.0、Gateway、Console、Agent、Loadgen v1.27.0。本次各产品更新了很多亮点功能，如 Easysearch 新增 rollup 功能，优化了多版本兼容配置；Console/Gateway/Agent/Loadgen 及 Framework 开源后，发布首个重大更新版本，支持过期元数据删除，指标图表懒加载，指标采集协程优化等等，欢迎大家下载体验。

INFINI Easysearch v1.9.0

Easysearch 本次更新如下：

Improvements

发布 rollup 功能
- 支持自动对 rollup 索引进行滚动，无需外部触发
- 支持 avg sum max min value_count percentiles 指标类型的聚合
- 支持 terms 聚合
- 支持对指标聚合进行 Pipeline 聚合
- 支持聚合前先对数据进行过滤
- 进行聚合查询时支持直接搜索原始索引，不用更改搜索代码
增加适配 logstash 8.x 的请求 header
_cat/templates 增加 lifecycle 和 rollover 列的展示

Bug fix

修复 rest-api template 测试错误

INFINI Console v1.27.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。开源地址：https://github.com/infinilabs/console

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Improvements

代码开源，统一采用 Github 仓库进行开发
指标采集优化，由原来的单一协程采集调整为每个注册的集群有单独的协程进行采集
指标监控页面图表展示采用懒加载、单个图表独立加载，增强用户体验
通用时间控件增加超时时间设置
集群选择控件增加注册、刷新功能
提供指标采集状态
表格控件排版优化

Bug fix

修复集群元数据更新不及时问题
修复帮助文档等链接不正确问题
修复节点、索引数据因随机 id 出现重复记录问题
修复 Runtime、Agent 实例编辑页面出错问题
修复集群、节点、索引、分片元数据无 Loading 问题
修复索引健康状态指标采集失败问题
修复个别菜单列未国际化问题

INFINI Gateway v1.27.0

INFINI Gateway 是一个面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。开源地址：https://github.com/infinilabs/gateway

Gateway 本次更新如下：

Improvements

调整队列消费者 slice 默认配置为 1

Bug fix

修复缓存数据丢失导致队列无法消费问题
同步更新 Framework 修复的一些已知问题

INFINI Agent v1.27.0

INFINI Agent 是 INFINI Console 的一个可选探针组件，负责采集和上传集群指标和日志等信息，并可通过 Console 管理。Agent 支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。开源地址：https://github.com/infinilabs/agent

探针 Agent 本次更新如下：

Improvements

与 INFINI Console 统一版本号
同步更新 Framework 修复的已知问题
支持 K8S 环境指标采集

INFINI Loadgen v1.27.0

INFINI Loadgen 是一款轻量、无依赖的 Eaysearch/Elasticsearch/OpenSearch 性能压测工具，支持参数模板化配置，支持压测端均衡流量控制，可以模拟高并发请求。开源地址：https://github.com/infinilabs/loadgen

Loadgen 本次更新如下：

Improvements

保持与 Console 相同版本
同步更新 Framework 修复的已知问题

Bug fix

修复 API 接口测试逻辑异常问题

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的核心公共代码库。开源地址：https://github.com/infinilabs/framework

Improvements

发布 1.0.0 Release 版本

期待反馈

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

官网：https://infinilabs.cn

INFINI Labs 助力开源与教育：免费许可证计划全面升级

开源项目 • INFINI Labs 小助手发表了文章 • 0 个评论 • 4416 次浏览 • 2024-06-19 17:21 • 来自相关话题

免费许可证计划

在数字化浪潮席卷全球的今天，INFINI Labs 深刻认识到开源项目和教育机构在技术创新与人才培养中的核心作用。因此，我们郑重推出全新升级的免费许可证计划，旨在全球范围内为开源社区和教育界提供有力支持，共同推动软件生态的繁荣与进步。

一、产品实力与荣誉

1.INFINI Pizza：实时搜索的新纪元

在第十三届“数据技术嘉年华”（DTC2024）上，INFINI Labs 发布了划时代的搜索引擎——INFINI Pizza，标志着搜索型数据库迈入实时搜索的新纪元。
INFINI Pizza 凭借先进的设计理念与架构，以及独有的专利技术，实现了对海量数据的无限伸缩，提供高效、准确的实时数据搜索能力

2.行业标杆案例

INFINI Labs 荣获中国信通院大数据“星河”标杆案例，其中移动云搜索数据库案例更是荣选为数据库标杆案例。
该案例基于移动云 Easysearch 数据库，通过创新的多集群协同模式，实现了数据高性能存取，展现出极高的经济价值与社会价值。

3.国家发明专利认可

INFINI Labs 的多项自主研发技术获得国家发明专利授权，这些成果彰显了公司在大数据领域的技术实力与创新精神。

二、品牌与行业地位

INFINI Labs 作为搜索型数据库产品领域的领军企业，积极参与行业标准的制定与推动。
其核心产品 INFINI Easysearch 荣获信通院首批可信搜索型数据库产品证书，再次印证了公司在行业中的领先地位。

三、产品介绍

Products

INFINI Easysearch：作为 Elasticsearch 的国产化替代方案，提供高度兼容性与卓越性能，满足企业级需求。
INFINI Console：轻量级多集群、跨版本搜索基础设施统一管控平台，助力企业高效管理搜索集群。
INFINI Gateway：专为 Elasticsearch 打造的高性能应用网关，提供丰富的功能特性与卓越性能。
INFINI Loadgen：支持多种搜索引擎的轻量级压测工具，为企业提供强大的数据加载与测试能力。
INFINI Pizza：引领实时搜索时代的新星，为企业提供高效、准确的实时数据搜索解决方案。

四、免费许可证计划

1.教育机构学术许可证

面向全球公立或私立学校、职业学校、大学等教育机构，提供非商业用途的软件使用许可。
有效期一年，符合条件的教育机构可继续申请。

2.开源项目许可证

面向非商业开源项目开发者，要求项目拥有活跃社区并在其官网添加 INFINI Labs 的链接。
许可证免费，有效期一年，符合条件的项目可继续申请。

五、申请方式

符合条件的开源项目和教育机构可通过访问 INFINI Labs 官方网站，轻松提交申请，我们将尽快审核并回复。

申请链接：https://infinilabs.cn/community

六、结语

INFINI Labs 以全新升级的免费许可证计划为契机，与全球开源社区和教育界携手合作，共同推动软件生态的创新与发展。让我们共同迎接更加美好的未来！

七、关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

联系我们

原文：https://infinilabs.cn/blog/2024/infini-labs-for-open-source-education-the-free-license-program-upgrades/

极限网关助力好未来 Elasticsearch 容器化升级

Elasticsearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 5393 次浏览 • 2024-06-12 15:01 • 来自相关话题

极限网关在好未来的最佳实践案例，轻松扛住日增百 TB 数据的流量，助力 ES 从物理机到云原生架构的改造，实现了流控、请求分析、安全管理、无缝迁移等场景。一次完美的客户体验~

背景

物理机架构时代

2022 年，好未来整个日志 Elasticsearch 拥有数十套服务集群，几百台物理机。这么多台机器耗费成本非常高，而且还要花费很大精力去维护。在人力资源有限情况下，存在非常多的弊端，运行成本高，不仅是机器折旧还有机柜等费用。

流量特征

这是来自某个业务线，如下图 1，真实流量，潮汐性非常明显。好未来有很多条业务线，几乎跟这个趋势都一致的，除了个别业务有“续报”、“开课”等活动特殊情况。潮汐性带来的问题就是高峰期 CPU、内存资源是可以消耗很高；低峰期资源使用量非常低，由于是物理架构，这些资源无法给其他业务线共享。

图1

降本增效-容器化改造原动力

日志服务对成本的空前的压力促使我们推进 Elasticsearch 进行架构改造；如何改造，改造成什么样子，这两个问题一直是推进改造原动力。业界能够同时对水平扩展和垂直扩展就是 K8S，我们开始对 Elasticsearch 改造成能在 K8S 上运行进行探索，从而提升 CPU、内存利用率。

物理机时代，没办法把资源动态的扩缩，动态调配，资源隔离，单靠人力操作调度成本太高，几乎无法完成；集群对内存资源需求要比 CPU 资源大很多，由于机器型号配置是固定的，无法“定制”，这也会导致成本居高不下。所以，无论从那个方面来讲，容器化优势非常明显，既能够优化成本，也能够降低运维复杂度。

ES 容器化改造

进行架构升级重点难点- API 服务

改造过程，我们遇到了很多问题，比如容器 ES 版本和物理机 ES 版本不一致，如何让 ES API 能够兼容不同的 ES 版本，由于版本的不兼容，导致无法直接使用原有的 tribenode 进行服务，怎么提供一个高可用的 Elasticsearch API 服务。我们考虑到多个方面，比如使用官方推荐的 proxy 模式、第三方服务等进行选择，经过多方面对比，选择了极限网关进行 tribenode 替换。

原始 ES API 服务痛点

API 访问没有流量控制
可观测性差，而且稳定性一般
版本兼容性差

物理机时代 API 架构

在物理机时代 ES 集群，API 架构如图 2，可以明显看到 tribe node 对所有 ES 集群的“侵入性”是非常大的，这就带来了很多问题，比较严重的就是单个集群对 ES tribenode 的影响和版本升级带来的不兼容问题。

图2

混合时代 API 架构

通过图 3，我们可以看到，极限网关对于版本兼容性很好，能够适配不同的版本。因此，最终选择极限网关作为下一代 ES API 服务方。

图3

里程碑：全部 ES 集群容器化

在 2023 年 3 月份，通过 Elastic 官方 ECK 模式，完成全部日志 ES 集群容器化改造，拥有数百节点，1PB+ 数据存储，每日新增数据 100T 左右。紧接着，除了日志服务外，同时支持了好未来多条业务线。

图4

极限网关实践

下面主要讲述了，为什么选择极限网关，以及极限网关在好未来落地、应用这些内容。

为什么选择极限网关？

学习成本低

我们可以从文档中看到极限网关，其架构简洁，语法简单，直观易懂。学习成本比较低，上手非常快，对新手友好。

性能强悍

经过压测，发现极限网关速度非常快，且针对 Elasticsearch 做了非常细致的优化，能成倍提升写入和查询的速度。

安全性高

支持多种认证方式，最简单的账号密码认证，可以给自定义多个账户密码，大大简化了 Elasticsearch 的安全设置，同时，还可以支持 LDAP 安全验证。

跨版本支持

我们容器化改造过程需要兼容不同版本的 Elasticsrearch，极限网关针对不同的 Elasticsearch 版本做了兼容和针对性处理，能够让业务代码无缝的进行适配，后端 Elasticsearch 集群版本升级能够做到无缝过渡，降低版本升级和数据迁移的复杂度，非常匹配我们的业务场景。

灵活可扩展

可灵活对每个请求进行干预和路由，支持路由的智能学习，内置丰富的过滤器，通过配置动态修改每个请求的处理逻辑，也支持通过插件来进行扩展，满足我们对流量的控制，尤其是限流、用户、IP 等这些功能非常实用。

启用安全策略-为 API 服务保驾护航

痛点

在升级之前使用 tribe 作为 API 服务提供后端，几乎相当于裸奔，没有任何认证策略；另外，tribe 本身的稳定性也有问题，官方在新版本逐渐废弃这种 CCS（跨集群搜索），期间出现多次服务崩溃。

极限网关解决问题

极限网关通过，“basic_auth” 插件，提供最基本的安全校验，使用起来非常方便；同时，极限网关提供 LDAP 插件，可以接入公共的 LDAP 服务，对所有的访问用户进行校验，安全策略对所有的用户生效，不用担心因为 IP 问题泄漏数据等。

强大的过滤功能

在使用 ES 集群过程中，许多场景，需要对请求进行控制、限制等操作。在这方便，感受到了极限网关强大的产品力。比如下面的两个场景

对异常流量进行限流

支持对 IP 限流
支持对 hostname 限流
支持 header 限流

对异常用户进行封禁

当 Elasticsearch 是通过 Basic Auth 或者 LDAP 方式来进行身份认证的时候，request_user_filter 过滤器可用来按请求的用户名信息来进行过滤。操作起来也非常简单，只需要 request_user_filter 这一个过滤器。

- request_user_filter:
    include:
        - "elastic"
    exclude：
        - "Ryan"

总结来讲，主要有这些方面的功能：

图5

优秀的可观测性

痛点

改造前经常为看不到直观的数据指标感到头疼，查看指标需要多个地方同时打开，去筛选，查找，非常繁琐，付出的成本非常大。为此，大家都再考虑如何优化这种情况，无奈优先级比较低，一直没有真正的投入时间去优化这块。

完美解决

使用了极限网关，通过收集请求日志，非常清晰的收集到想要的数据，具体如下：

总体方面：
- 流量曲线
- 状态码占比
- 缓存统计
- 每台网关请求流量
细节方面：
- 打印每次请求语句
- 可以查看请求到具体 ES 节点流量
- 可以查看过滤器的列表

通过下图，我们可以从管理视角直观的看到各种信息，这对于管理员来讲，省时省力，方便快捷。

图6

意外收获：无缝迁移业务 Elasticsearch 上云

由于前期日志业务上云，受到非常好的反馈，多个业务线期望能够上云上服务，达到降本增效的目的。

支持双写

数据可以通过极限网关同时写入两个 ES 集群，能够保障数据完全一致，安全可靠。

无缝切换

切换很丝滑，影响非常小，能够让外界几乎感受不到服务波动。

图7

通过使用极限网关，自建 ES 集群可以无缝的迁移上云，在整个迁移的过程中，两套集群通过网关进行了解耦，在迁移的过程中还能实现版本的无缝升级，极大降低了迁移成本，提高迁移效率，多次验证服务稳定可靠。

极限网关流量概览

这是其中一套极限网关的流量统计。用这部分数据进行巡检，一目了然，做到全局的掌控，提高感知力度。

图8

极限网关使用总结

极限网关提供一系列高性能和高可靠性的网关服务。使用这样的服务给我们带来以下好处：

可观测性好：极限网关可以动态的对 Elasticsearch 运行过程中请求进行拦截和分析，通过指标和日志来了解集群运行状态，这些指标可以用于提升性能和业务优化。
增强安全性：包含先进的安全机制，如 basicauth、LDAP 等支持，保护用户数据不受未授权访问和各种网络威胁的侵害。
高稳定性：通过冗余设计和故障转移机制，极限网关能够确保网络服务的高可用性，即使在某些组件发生故障时也能保持服务不中断，单版本最长服务超过 15 个月。
易于管理：通过提供 INFINI Console 简洁直观的管理界面，让用户能够轻松配置和监控网络状态，提升管理效率。
客户支持：良好的客户服务支持可以帮助用户快速解决使用过程中遇到的问题，提供专业的技术指导。

综上所述，极限网关为用户提供了一个高速、安全、稳定且易于管理的 ES 网关，适合对网络性能有较高要求的个人和企业用户。

未来规划

第一阶段，完成了日志 ES 集群，所有集群的容器化改造，合并，成功的把成本降低了 60%以上。这期间积累了丰富容器化经验，为业务 ES 集群上容器做了良好的铺垫；成本优势和运维优势吸引越来越多的业务接入到容器化 ES 集群。

提升 ES 集群效能--新技术应用&&版本升级

极限科技官方推荐的 Easysearch 在压缩率，查询速度等等方面有很多的优势，通过长时间的测试稳定性，新特性，对比云原生的 ES 集群，根据测试结果，给“客户”提供多种选择，这也是工作重点之一。
我们当前使用的 ES 版本是 6.8，已经远远落后于官方版本，今年我们计划在选择合适的集群升级 ES 版本，拥抱更多官方提供的特性。

混合（多）云架构支持

随着越来越多的 ES 集群在机房的 K8S 集群部署，这里资源出现了紧张局面。我们尝试在云上部署自建 ES 集群，弥补机房资源有限，无法大规模扩容，同时能够支持多活场景，满足更多客户的不同需求。混合云主要实现以下几种能力：

1、扩缩容：满足不同业务灵活适配

混合（多）云部署，可以让负载内部私有云 ES，同时部署到公有云，提升扩展 IT 基础设施不仅局限于 CPU、内存，还有存储。比如某一个业务要做活动，预估流量“大爆发”，需要提前准备大规模资源，在机房内根本来不及采购扩容支持，然而在公有云上就能很方便扩容、缩容。在云上搭建 ES 集群，设置满足需求的数量、容量、配置，配合极限网关路由策略，精准的把控流量流向。

图9

2、灾备：紧急情况快速部署，恢复 ES 集群读写

当机房级别大规模故障，部分业务实现了多活，单一的机房故障不会影响其服务能力，而此时比如日志查看等仍有需求，为了满足这部分“客户”需求，可以在云上 K8S 集群，快速搭建 ES 集群，恢复日志读写功能。

图10

参考文档：

作者：张华勋，前新浪 CDN 研发，工作主要涉及 Mysql、MongoDB、Redis、Elasticsearch、流量调度等组件和系统，以及运维自动化、平台化等工作。现就职于好未来。

关于好未来

好未来（NYSE：TAL）是一家以内容能力与科技能力为基础，以科教、科创、科普为战略方向，助力人的终身成长，并持续探索创新的科技公司。好未来的前身学而思成立于 2003 年，2010 年在美国纽交所正式挂牌交易。好未来以“爱与科技助力终身成长”为使命，致力成为持续创新的组织。更多参见：https://www.100tal.com/

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

联系我们

INFINI Labs 产品更新 | Easysearch 1.8.2 发布优化 CCR 性能

Easysearch • liaosy 发表了文章 • 0 个评论 • 5649 次浏览 • 2024-06-09 12:52 • 来自相关话题

INFINI Labs 产品又更新啦~，包括 Easysearch v1.8.2、Gateway、Console、Agent、Loadgen v1.26.0。本次各产品更新了很多亮点功能，如 Easysearch 优化 CCR 同步性能；Gateway 增加了 HTTP 请求动态域名路由功能，移除了安全相关的 Filter，进一步提升 Gateway 稳定性；Console 修复了多个已知问题，如当文档数过亿时单位换算错误，修复了因采集延迟导致指标图表显示异常，修复了多行查询中包含 SQL 查询异常等问题。欢迎大家下载体验。

以下是本次更新的详细说明。

INFINI Easysearch v1.8.2

INFINI Easysearch 是一个分布式的近实时搜索与分析引擎，核心引擎基于开源的 Apache Lucene。Easysearch 的目标是提供一个轻量级的 Elasticsearch 可替代版本，并继续完善和支持更多的企业级功能。

Easysearch 本次更新如下：

Bug fix

修复 source_reuse 与 object 字段为 enable: false 时的冲突

Improvements

升级部分依赖包版本，Commons-collections to 3.2.2, Snakeyaml to 2.0
优化 CCR 同步性能及调整 CCR 全局配置参数
优化插件配置命名，去除"plugins."
优化配置文件目录获取命名

INFINI Console v1.26.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复监控数据布局
修复命令存储权限
修复多行请求包含 SQL 语法
修复文档数过亿时换算错误
修复导入低版本 v1.6.0 告警规则缺少字段问题
修复当 buck_size 小于 60 秒时，因指标采集延迟导致指标显示异常问题

INFINI Gateway v1.26.0

INFINI Gateway 是一个面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

Improvements

feat: add wildcard_domain filter
chore: remove security filter and translog_viewer

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

Improvements

feat: support dynamic app setting
feat: add cluster settings query args
feat: add gateway config
feat: add http interceptor
feat: return host info in info api
feat: add util to convert string to float
feat: use common app setting api to instead of auth setting api
feat: crontab task support multi crontab expression
fix: skip submit empty bulk requests
feat: support ccr api
fix: get latest offset should compare segment first
fix: wrong use of zstd with vfs
fix: prevent close closed channel
fix: panic on error while saving keystore

期待反馈

下载地址： https://www.infinilabs.cn/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

INFINI Labs 产品更新 | Console 1.24.0 操作日志审计功能发布

资讯动态 • liaosy 发表了文章 • 0 个评论 • 4641 次浏览 • 2024-04-28 12:51 • 来自相关话题

INFINI Labs 产品又更新啦~，包括 Console，Gateway 1.24.0。本次各产品更新了很多亮点功能，如 Console 增加操作日志审计功能，优化数据探索字段统计，修复 Gateway 增加认证后添加实例失败等问题。以下是本次更新的详细说明。

INFINI Console v1.24.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Features

用户操作审计日志功能
新增告警规则克隆一键克隆功能，简化重复类型告警的创建

Bug fix

修复普通用户权限 403 问题
修复探针管理表格展开显示错位问题

Improvements

优化开发工具集群选择控件显示位置
优化数据探索查询控件显示宽度
优化数据探索字段统计功能
优化告警规则列表页搜索，支持远程搜索
Discover 左侧字段聚合支持开关控制拉取本地或远程统计值

INFINI Gateway v1.24.0

Gateway 本次更新如下：

Improvements

Refactoring http client tls config
Write field routing to bulk metadata when field _routing exists in scrolled doc

Bug fix

Fix(reshuffle filter): make sure queue config always have label type
Fix rotate config usage

INFINI Framework

Improvements

feat: allow to use default auth for agent’s auto enroll
refactor: refactor func GetFieldCaps
feat: register background job to clean up badger LSM tree
fix: skip load missing wal

期待反馈

下载地址： https://www.infinilabs.cn/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

INFINI Labs 产品更新 | Easysearch 1.7.1发布，改进跨集群复制的数据加载等

Easysearch • liaosy 发表了文章 • 0 个评论 • 3484 次浏览 • 2024-03-04 15:25 • 来自相关话题

INFINI Labs 产品又更新啦~，包括 Console，Gateway，Agent 1.23.0 和 Easysearch 1.7.1。本次各产品更新了很多亮点功能，如 Console 优化实例管理中增加磁盘空闲空间显示，Easysearch 改进 HierarchyCircuitBreakerService 并添加断路器、改进跨集群复制的数据加载，增加对 source_reuse 索引的支持等。欢迎大家下载体验。

以下是本次更新的详细说明。

INFINI Easysearch v1.7.1

Easysearch 本次更新如下：

Bug fix

修复 source_reuse 与字段别名冲突
改进 HierarchyCircuitBreakerService 并添加断路器
修复 _meta 不为空且启用 source_reuse 时的映射解析错误
修复 source_reuse 下对多值还原不正确的问题

Improvements

改进 HierarchyCircuitBreakerService 并添加断路器
改进跨集群复制的数据加载，增加对 source_reuse 索引的支持

INFINI Console v1.23.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复数据迁移中数据分片范围因精度导致数据溢出显示为负数
修复删除实例队列后消费的 Offset 未重置问题
修复网友提出的各种问题，如集群设置默认打开节点、索引采集等

Improvements

优化初始化配置向导，分步骤执行
优化实例管理中增加磁盘空闲空间显示
优化实例队列名称显示

INFINI Gateway v1.23.0

Gateway 本次更新如下：

Bug fix

修复删除实例队列后消费的 Offset 未重置问题

期待反馈

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.com

如何防止 Elasticsearch 服务 OOM？

Easysearch • yangmf2040 发表了文章 • 0 个评论 • 3932 次浏览 • 2024-02-26 10:12 • 来自相关话题

Elasticsearch（简称：ES）和传统关系型数据库有很多区别，比如传统数据中普遍都有一个叫“最大连接数”的设置。目的是使数据库系统工作在可控的负载下，避免出现负载过高，资源耗尽，谁也无法登录的局面。

那 ES 在这方面有类似参数吗？答案是没有，这也是为何 ES 会被流量打爆的原因之一。

针对大并发访问 ES 服务，造成 ES 节点 OOM，服务中断的情况，极限科技旗下的 INFINI Gateway 产品（以下简称 “极限网关”）可从两个方面入手，保障 ES 服务的可用性。

限制最大并发访问连接数。
限制非重要索引的请求速度，保障重要业务索引的访问速度。

下面我们来详细聊聊。

架构图

所有访问 ES 的请求都发给网关，可部署多个网关。

限制最大连接数

在网关配置文件中，默认有最大并发连接数限制，默认最大 10000。

entry:
  - name: my_es_entry
    enabled: true
    router: my_router
    max_concurrency: 10000
    network:
      binding: $[[env.GW_BINDING]]
      # See `gateway.disable_reuse_port_by_default` for more information.
      reuse_port: true

使用压测程序测试，看看到达10000个连接后，能否限制新的连接。超过的连接请求，被丢弃。更多信息参考官方文档。

限制索引写入速度

我们先看看不做限制的时候，测试环境的写入速度，在 9w - 15w docs/s 之间波动。虽然峰值很高，但不稳定。接下来，我们通过网关把写入速度控制在最大 1w docs/s 。对网关的配置文件 gateway.yml ，做以下修改。

env: # env 下添加
    THROTTLE_BULK_INDEXING_MAX_BYTES: 40485760 #40MB/s
    THROTTLE_BULK_INDEXING_MAX_REQUESTS: 10000 #10k docs/s
    THROTTLE_BULK_INDEXING_ACTION: retry #retry,drop
    THROTTLE_BULK_INDEXING_MAX_RETRY_TIMES: 10 #1000
    THROTTLE_BULK_INDEXING_RETRY_DELAY_IN_MS: 100 #10

router: # route 部分修改 flow
  - name: my_router
    default_flow: default_flow
    tracing_flow: logging_flow
    rules:
      - method:
          - "*"
        pattern:
          - "/_bulk"
          - "/{any_index}/_bulk"
        flow:
          - write_flow

flow: #flow 部分增加下面两段    
  - name: write_flow
    filter:
      - flow:
          flows:
            - bulking_indexing_limit
      - elasticsearch:
          elasticsearch: prod
          max_connection_per_node: 1000
  - name: bulking_indexing_limit
    filter:
      - bulk_request_throttle:
          indices:
            "test-index":
              max_bytes: $[[env.THROTTLE_BULK_INDEXING_MAX_BYTES]]
              max_requests: $[[env.THROTTLE_BULK_INDEXING_MAX_REQUESTS]]
              action: $[[env.THROTTLE_BULK_INDEXING_ACTION]]
              retry_delay_in_ms: $[[env.THROTTLE_BULK_INDEXING_RETRY_DELAY_IN_MS]]
              max_retry_times: $[[env.THROTTLE_BULK_INDEXING_MAX_RETRY_TIMES]]
              message: "bulk writing too fast" #触发限流告警message自定义
              log_warn_message: true

再次压测，test-index 索引写入速度被限制在了 1w docs/s 。

限制多个索引写入速度

上面的配置是针对 test-index 索引的写入速度控制。如果想添加其他的索引，新增一段配置即可。比如，我允许 abc 索引写入达到 2w docs/s，test-index 索引最多不超过 1w docs/s ，可配置如下。

  - name: bulking_indexing_limit
    filter:
      - bulk_request_throttle:
          indices:
            "abc":
              max_requests: 20000
              action: drop
              message: "abc doc写入超阈值" #触发限流告警message自定义
              log_warn_message: true
            "test-index":
              max_bytes: $[[env.THROTTLE_BULK_INDEXING_MAX_BYTES]]
              max_requests: $[[env.THROTTLE_BULK_INDEXING_MAX_REQUESTS]]
              action: $[[env.THROTTLE_BULK_INDEXING_ACTION]]
              retry_delay_in_ms: $[[env.THROTTLE_BULK_INDEXING_RETRY_DELAY_IN_MS]]
              max_retry_times: $[[env.THROTTLE_BULK_INDEXING_MAX_RETRY_TIMES]]
              message: "bulk writing too fast" #触发限流告警message自定义
              log_warn_message: true

限速效果如下

限制读请求速度

我们先看看不做限制的时候，测试环境的读取速度，7w qps 。接下来我们通过网关把读取速度控制在最大 1w qps 。继续对网关的配置文件 gateway.yml 做以下修改。

  - name: default_flow
    filter:
      - request_path_limiter:
          message: "Hey, You just reached our request limit!"                                      rules:      
            - pattern: "/(?P<index_name>abc)/_search"                          
              max_qps: 10000
              group: index_name                                    
      - elasticsearch: 
          elasticsearch: prod                            
          max_connection_per_node: 1000

再次进行测试，读取速度被限制在了 1w qps 。

限制多个索引读取速度

上面的配置是针对 abc 索引的写入速度控制。如果想添加其他的索引，新增一段配置即可。比如，我允许 abc 索引读取达到 1w qps，test-index 索引最多不超过 2w qps ，可配置如下。

  - name: default_flow
    filter:
      - request_path_limiter:
          message: "Hey, You just reached our request limit!"
          rules:
            - pattern: "/(?P<index_name>abc)/_search"
              max_qps: 10000
              group: index_name
            - pattern: "/(?P<index_name>test-index)/_search"
              max_qps: 20000
              group: index_name
      - elasticsearch:
          elasticsearch: prod
          max_connection_per_node: 1000

多个网关限速

限速是每个网关自身的控制，如果有多个网关，那么后端 ES 集群收到的请求数等于多个网关限速的总和。本次介绍就到这里了。相信大家在使用 ES 的过程中也遇到过各种各样的问题。欢迎大家来我们这个平台分享自己的问题、解决方案等。如有任何问题，请随时联系我，期待与您交流！

INFINI Labs 产品更新 | Console 数据迁移支持 Percentiles 均匀分区

资讯动态 • liaosy 发表了文章 • 0 个评论 • 4568 次浏览 • 2023-12-30 16:25 • 来自相关话题

INFINI Labs 产品又更新啦~，包括 Console v1.14.0，Gateway 1.21.0。其中 Console 数据迁移支持 Percentiles 均匀分区，修复已知 Bug 等。以下是本次更新的详细说明。

INFINI Console v1.14.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Features

数据迁移支持 decimal 类型分区设置
数据迁移支持 number 类型均匀分区

Bug fix

修复告警恢复后，新周期内没有发送告警通知消息的问题

INFINI Gateway v1.21.0

Gateway 本次更新如下：

Bug fix

fix log error when temp file was missing

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

feat: support even partition
feat: support nested object
fix log error when temp file was missing

期待反馈

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.com

INFINI Labs 产品更新 | 修复 Easysearch 跨集群复制索引同步问题，Gateway 内存异常增长等问题

Easysearch • liaosy 发表了文章 • 0 个评论 • 3815 次浏览 • 2023-12-01 18:45 • 来自相关话题

INFINI Labs 产品又更新啦~，本次更新主要对 Easysearch、Gateway、Console、Agent 等产品功能进行优化和相关 Bug 修复，解决了内存异常增长等问题，以下是详细说明。

INFINI Easysearch v1.6.2

Easysearch 本次更新如下：

Bug fix

修复跨集群复制（CCR）不能对自动滚动生成的索引进行同步的问题

Improvements

优化初始化脚本，增加-s/-slient 参数，自动安装。
新增含 jdk/plugins 的 bundle 安装包

INFINI Gateway v1.20.0

Gateway 本次更新如下：

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

增加配置，允许设置 fasthttp client 相关参数

INFINI Console v1.12.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复数据探索 multi fields 字段计算 top values 报错的问题
修复由 Framework Bug 造成连接数不释放、内存异常增长的问题
修复内网模式下静态资源远程加载的问题
修复数据看板数据源配置校验异常的问题

Improvements

优化数据探索计算 top values，使用先采样后，后取 top values
可通过配置参数 http_client.read_buffer_size 设置读取缓存大小，解决开发工具执行命令时，默认缓存太小的问题

INFINI Agent v0.7.1

INFINI Agent 是 INFINI Console 的一个可选探针组件，负责采集和上传集群指标和日志等信息，并可通过 Console 管理。Agent 支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

Features

添加 http processor

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

进一步优化内存占用，降到 50M 以下

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

fix: fix the issue of disk queue was blocked
chore: checkout specify branch before pull

期待反馈

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.com

INFINI Gateway和 Console 更新发布啦！

资讯动态 • liaosy 发表了文章 • 0 个评论 • 9696 次浏览 • 2023-02-10 23:12 • 来自相关话题

INFINI Labs 产品更新发布

Hi，大家好。今天 INFINI Labs 为大家带来 2023 春节后第一波产品更新发布，欢迎大家免费下载体验使用。

INFINI Gateway v1.9.0

极限网关本次迭代带来了大量的更新如下：

Breaking changes

Refactoring config for ip access control
Disable elasticsearch metadata refresh by default
Update default config path from configs to config
Remove sample-configs, moved to dedicated integrated-testing project
Remove field conntime, update field @timestamp to timestamp in logging filter
Rename disorder to fast

Features

Support listen on IPv6 address
Add general health api
Add request_ip to context
Add badger filter plugin
Allow to split produce and consume messages from s3
Add bulk_request_throttle filter
Support access request context and more output options in echo filter
Add body_json to response context
Add cert config to API module, support mTLS
Add api to clear scroll context
Floating_ip support stick by priority
Add keystore util
Allow to save success bulk results in bulk_indexing processor
Enable watch and reload the major config file
Support run background job in one goroutine
Allow to handle async_bulk request logging
Add config to control cluster health check while cluster not available, set default to false
Allow to follow redirects in http filter, set default read and write timeout to 30s
Support collect instance metrics to monitoring gateway
Add json log format

Bug fix

Fix user was removed in logging filter
Fix incorrect message size issue, reload when files changed in disk_queue
Fix issue that index_diff could not finished automatically
Fix hostname was not well updated in filter set_request_header or set_hostname
Fix to check consumer’s lag instead of queue’s lag in flow_runner processor
Fix file not found error for disk_queue
Fix the delete requests was not proper handled in filter bulk_reshuffle, bulk_request_mutate and bulk_indexing processor
Fix memory leak caused by misuse of bytes buffer
Fix to handle the last request in replay processor
Fix url args was not updated after change
Fix memory leak when serving high-concurrent requests
Fix nil id caused error when using sliced workers in bulk_indexing processor
Fix index name with dot
Refactoring time fields for orm, skip empty time
Refactoring stats, allow to register extended stats
Fix to restart gateway entrypoint on flow change
Update ratio filter, fix random number, add header to ratio filter
Fix query parameter no_cache was not well respected in get_cache filter
Fix single delete request was ignored in bulk requests
Fix request mutate filter

Improvements

Remove newline in indexing_merge and json_indexing processor
Improve instance check, add config to disable
Add option skip_insecure_verify to s3 module
Improve instance check, enable config to disable
Update the way to get ctx process info, optimize memory usage
Improve indexing performance for bulk_indexing processor
Refactoring disk_queue, speedup message consumption
Enable segment compress for disk_queue by default
Skip download s3 files when s3 was not enabled
Add option to log warning messages for throttle filters
Optimize hash performance for getting primary shardID and partitionID
Add cache for get index routing table
Optimize performance for bulk response processing
Refactoring bulk_processor, pass meta info to payload func
Don’t call payload func for delete action
Improve queue consumer’s lag check
Enable prepare flat files ahead for read by default, skip unnecessary file
Add object pool for xxhash
Refactoring disk_queue, handle consumer in-flight segments in memory
Add config to remove duplicated newline for bulk_processor
Add metric timestamp in stats api
Improve error on routing table missing
Refactoring bytes buffer and object pool, expose metrics via API
Refactoring tasks pooling, support throttle and unified control
Optimize badger file size and memory usage
Refactoring time fields for orm, skip empty time
Refactoring stats, allow to register extended stats
Refactoring to handle bulk response results
Add client_session_cache_size to tls setting
Safety add newline to each bytes when handle bulk requests

INFINI Console v0.7.0

INFINI Console 本次迭代更新如下：

新增初始化安装向导；
新增系统服务健康监控；
新增 License 授权；
新增索引和节点层面数据字节写入吞吐量指标(indexing bytes)；
修复了 Discover 第一次加载未发起搜索请求的问题；
修复了查看节点线程池指标时选择多个节点后指标不显示的问题；

期待反馈

INFINI Gateway： https://github.com/infinilabs/gateway/issues
INFINI Console： https://github.com/infinilabs/console/issues
下载地址： https://www.infinilabs.com/download/

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

也欢迎大家添加微信小助手(INFINI-Labs)拉群交流和学习。

感谢大家的围观，祝大家周末愉快。

使用极限网关来进行 Elasticsearch 跨集群跨版本查询及所有其它请求

Elasticsearch • medcl 发表了文章 • 9 个评论 • 9298 次浏览 • 2021-10-16 11:31 • 来自相关话题

使用场景

如果你的业务需要用到有多个集群，并且版本还不一样，是不是管理起来很麻烦，如果能够通过一个 API 来进行查询就方便了，聪明的你相信已经想到了 CCS，没错用 CCS 可以实现跨集群的查询，不过 Elasticsearch 提供的 CCS 对版本有一点的限制，并且需要提前做好 mTLS，也就是需要提前配置好两个集群之间的证书互信，这个免不了要重启维护，好像有点麻烦，那么问题来咯，有没有更好的方案呢？

😁 有办法，今天我就给大家介绍一个基于极限网关的方案，极限网关的网址：http://极限网关.com/。

假设现在有两个集群，一个集群是 v2.4.6，有不少业务数据，舍不得删，里面有很多好东西：）还有一个集群是 v7.14.0，版本还算比较新，业务正在做的一个新的试点，没什么好东西，但是也得用 :(，现在老板们的的需求是希望通过在一个统一的接口就能访问这些数据，程序员懒得很，懂得都懂。

集群信息

v2.4.6 集群的访问入口地址：192.168.3.188:9202
v7.14.0 集群的访问入口地址：192.168.3.188:9206

这两个集群都是 http 协议的。

实现步骤

今天用到的是极限网关的 switch 过滤器：https://极限网关.com/docs/references/filters/switch/

网关下载下来就两个文件，一个主程序，一个配置文件，记得下载对应操作系统的包。

定义两个集群资源

elasticsearch:
  - name: v2
    enabled: true
    endpoint: http://192.168.3.188:9202
  - name: v7
    enabled: true
    endpoint: http://192.168.3.188:9206

上面定义了两个集群，分别命名为 v2 和 v7，待会会用到这些资源。

定义一个服务入口

entry:
  - name: my_es_entry
    enabled: true
    router: my_router
    max_concurrency: 1000
    network:
      binding: 0.0.0.0:8000
    tls:
      enabled: true

这里定义了一个名为 my_es_entry 的资源入口，并引用了一个名为 my_router 的请求转发路由，同时绑定了网卡的 0.0.0.0:8000 也就是所有本地网卡监听 IP 的 8000 端口，访问任意 IP 的 8000 端口就能访问到这个网关了。

另外老板也说了，Elasticsearch 用 HTTP 协议简直就是裸奔，通过这里开启 tls，可以让网关对外提供的是 HTTPS 协议，这样用户连接的 Elasticsearch 服务就自带 buffer 了，后端的 es 集群和网关直接可以做好网络流量隔离，集群不用动，简直完美。

为什么定义 TLS 不用指定证书，好用的软件不需要这么麻烦，就这样，不解释。

最后，通过设置 max_concurrency 为 1000，限制下并发数，避免野猴子把我们的后端的 Elasticsearch 给压挂了。

定义一个请求路由

router:
  - name: my_router
    default_flow: cross-cluster-search

这里的名称 my_router 就是表示上面的服务入口的router 参数指定的值。

另外设置一个 default_flow 来将所有的请求都转发给一个名为 cross-cluster-search 的请求处理流程，还没定义，别急，马上。

定义请求处理流程

来啦，来啦，先定义两个 flow，如下，分别名为 v2-flow 和 v7-flow，每节配置的 filter 定义了一系列过滤器，用来对请求进行处理，这里就用了一个 elasticsearch 过滤器，也就是转发请求给指定的 Elasticsearch 后端服务器，了否？

flow:
  - name: v2-flow
    filter:
      - elasticsearch:
          elasticsearch: v2
  - name: v7-flow
    filter:
      - elasticsearch:
          elasticsearch: v7

然后，在定义额外一个名为 cross-cluster-search 的 flow，如下：

  - name: cross-cluster-search
    filter:
      - switch:
          path_rules:
            - prefix: "v2:"
              flow: v2-flow
            - prefix: "v7:"
              flow: v7-flow

这个 flow 就是通过请求的路径的前缀来进行路由的过滤器，如果是 v2:开头的请求，则转发给 v2-flow 继续处理，如果是 v7: 开头的请求，则转发给 v7-flow 来处理，使用的用法和 CCS 是一样的。so easy！

对了，那是不是每个请求都需要加前缀啊，费事啊，没事，在这个 cross-cluster-search 的 filter 最后再加上一个 elasticsearch filter，前面前缀匹配不上的都会走它，假设默认都走 v7，最后完整的 flow 配置如下：

flow:
  - name: v2-flow
    filter:
      - elasticsearch:
          elasticsearch: v2
  - name: v7-flow
    filter:
      - elasticsearch:
          elasticsearch: v7
  - name: cross-cluster-search
    filter:
      - switch:
          path_rules:
            - prefix: "v2:"
              flow: v2-flow
            - prefix: "v7:"
              flow: v7-flow
      - elasticsearch:
          elasticsearch: v7

然后就没有然后了，因为就配置这些就行了。

启动网关

假设配置文件的路径为 sample-configs/cross-cluster-search.yml，运行如下命令：

➜  gateway git:(master) ✗ ./bin/gateway -config sample-configs/cross-cluster-search.yml
   ___   _   _____  __  __    __  _       
  / _ \ /_\ /__   \/__\/ / /\ \ \/_\ /\_/\
 / /_\///_\\  / /\/_\  \ \/  \/ //_\\\_ _/
/ /_\\/  _  \/ / //__   \  /\  /  _  \/ \ 
\____/\_/ \_/\/  \__/    \/  \/\_/ \_/\_/ 

[GATEWAY] A light-weight, powerful and high-performance elasticsearch gateway.
[GATEWAY] 1.0.0_SNAPSHOT, 2021-10-15 16:25:56, 3d0a1cd
[10-16 11:00:52] [INF] [app.go:228] initializing gateway.
[10-16 11:00:52] [INF] [instance.go:24] workspace: data/gateway/nodes/0
[10-16 11:00:52] [INF] [api.go:260] api listen at: http://0.0.0.0:2900
[10-16 11:00:52] [INF] [reverseproxy.go:257] elasticsearch [v7] hosts: [] => [192.168.3.188:9206]
[10-16 11:00:52] [INF] [entry.go:225] auto generating cert files
[10-16 11:00:52] [INF] [actions.go:223] elasticsearch [v2] is available
[10-16 11:00:52] [INF] [actions.go:223] elasticsearch [v7] is available
[10-16 11:00:53] [INF] [entry.go:296] entry [my_es_entry] listen at: https://0.0.0.0:8000
[10-16 11:00:53] [INF] [app.go:309] gateway is running now.

可以看到网关输出了启动成功的日志，网关服务监听在 https://0.0.0.0:8000 。

试试访问网关

直接访问网关的 8000 端口，因为是网关自签的证书，加上 -k 来跳过证书的校验，如下：

➜  loadgen git:(master) ✗ curl -k   https://localhost:8000  
{
  "name" : "LENOVO",
  "cluster_name" : "es-v7140",
  "cluster_uuid" : "npWjpIZmS8iP_p3GK01-xg",
  "version" : {
    "number" : "7.14.0",
    "build_flavor" : "default",
    "build_type" : "zip",
    "build_hash" : "dd5a0a2acaa2045ff9624f3729fc8a6f40835aa1",
    "build_date" : "2021-07-29T20:49:32.864135063Z",
    "build_snapshot" : false,
    "lucene_version" : "8.9.0",
    "minimum_wire_compatibility_version" : "6.8.0",
    "minimum_index_compatibility_version" : "6.0.0-beta1"
  },
  "tagline" : "You Know, for Search"
}

正如前面配置所配置的一样，默认请求访问的就是 v7 集群。

访问 v2 集群

➜  loadgen git:(master) ✗ curl -k   https://localhost:8000/v2:/    
{
  "name" : "Solomon O'Sullivan",
  "cluster_name" : "es-v246",
  "cluster_uuid" : "cqlpjByvQVWDAv6VvRwPAw",
  "version" : {
    "number" : "2.4.6",
    "build_hash" : "5376dca9f70f3abef96a77f4bb22720ace8240fd",
    "build_timestamp" : "2017-07-18T12:17:44Z",
    "build_snapshot" : false,
    "lucene_version" : "5.5.4"
  },
  "tagline" : "You Know, for Search"
}

查看集群信息：

➜  loadgen git:(master) ✗ curl -k   https://localhost:8000/v2:_cluster/health\?pretty
{
  "cluster_name" : "es-v246",
  "status" : "yellow",
  "timed_out" : false,
  "number_of_nodes" : 1,
  "number_of_data_nodes" : 1,
  "active_primary_shards" : 5,
  "active_shards" : 5,
  "relocating_shards" : 0,
  "initializing_shards" : 0,
  "unassigned_shards" : 5,
  "delayed_unassigned_shards" : 0,
  "number_of_pending_tasks" : 0,
  "number_of_in_flight_fetch" : 0,
  "task_max_waiting_in_queue_millis" : 0,
  "active_shards_percent_as_number" : 50.0
}

插入一条文档：

➜  loadgen git:(master) ✗ curl-json -k   https://localhost:8000/v2:medcl/doc/1 -d '{"name":"hello world"}'
{"_index":"medcl","_type":"doc","_id":"1","_version":1,"_shards":{"total":2,"successful":1,"failed":0},"created":true}%

执行一个查询

➜  loadgen git:(master) ✗ curl -k   https://localhost:8000/v2:medcl/_search\?q\=name:hello                
{"took":78,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":0.19178301,"hits":[{"_index":"medcl","_type":"doc","_id":"1","_score":0.19178301,"_source":{"name":"hello world"}}]}}%

可以看到，所有的请求，不管是集群的操作，还是索引的增删改查都可以，而 Elasticsearch 自带的 CCS 是只读的，只能进行查询。

访问 v7 集群

➜  loadgen git:(master) ✗ curl -k   https://localhost:8000/v7:/
{
  "name" : "LENOVO",
  "cluster_name" : "es-v7140",
  "cluster_uuid" : "npWjpIZmS8iP_p3GK01-xg",
  "version" : {
    "number" : "7.14.0",
    "build_flavor" : "default",
    "build_type" : "zip",
    "build_hash" : "dd5a0a2acaa2045ff9624f3729fc8a6f40835aa1",
    "build_date" : "2021-07-29T20:49:32.864135063Z",
    "build_snapshot" : false,
    "lucene_version" : "8.9.0",
    "minimum_wire_compatibility_version" : "6.8.0",
    "minimum_index_compatibility_version" : "6.0.0-beta1"
  },
  "tagline" : "You Know, for Search"
}

Kibana 里面访问

完全没问题，有图有真相：

其他操作也类似，就不重复了。

完整的配置

path.data: data
path.logs: log

entry:
  - name: my_es_entry
    enabled: true
    router: my_router
    max_concurrency: 10000
    network:
      binding: 0.0.0.0:8000
    tls:
      enabled: true

flow:
  - name: v2-flow
    filter:
      - elasticsearch:
          elasticsearch: v2
  - name: v7-flow
    filter:
      - elasticsearch:
          elasticsearch: v7
  - name: cross-cluster-search
    filter:
      - switch:
          path_rules:
            - prefix: "v2:"
              flow: v2-flow
            - prefix: "v7:"
              flow: v7-flow
      - elasticsearch:
          elasticsearch: v7

router:
  - name: my_router
    default_flow: cross-cluster-search

elasticsearch:
  - name: v2
    enabled: true
    endpoint: http://192.168.3.188:9202
  - name: v7
    enabled: true
    endpoint: http://192.168.3.188:9206

小结

好了，今天给大家分享的如何使用极限网关来进行 Elasticsearch 跨集群跨版本的操作就到这里了，希望大家周末玩的开心。😁

集群中gateway.*参数有不同值会导致什么结果？

Elasticsearch • medcl 回复了问题 • 2 人关注 • 1 个回复 • 4559 次浏览 • 2017-07-24 10:59 • 来自相关话题

信创环境下部署 INFINI Gateway：为 Easysearch 构建高性能安全入口

Easysearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 11650 次浏览 • 2026-06-11 17:17 • 来自相关话题

引言

例如，下面这些问题在生产环境中非常常见：

如何防止某个应用或用户发出超大查询请求，把 Easysearch 集群拖垮？
如果 Easysearch 某个节点突然宕机，请求能不能自动切换到健康节点，让业务无感知？
如何知道每天有多少次查询、哪些查询慢、哪些请求不合法，有没有办法对请求进行审计？

一、INFINI Gateway 是什么？和 Easysearch 是什么关系？

从技术层面讲，INFINI Gateway 的定位如下：

高性能数据网关：面向搜索场景设计，请求先在网关完成处理，再转发到后端 Easysearch 集群。
代理 + 增强：位于客户端与 Easysearch 之间，可在转发链路中叠加限流、缓存加速、请求审计、结果改写等能力。
兼容原生 API：对外接口兼容 Elasticsearch / Easysearch 原生 API，应用只需把连接地址从直连 Easysearch 改为指向网关，无需改业务代码。
轻量易部署：基于 Golang 开发，安装包约 10MB，无额外外部依赖。
信创兼容认证：已通过华为鲲鹏 Kunpeng 920 兼容性认证，并获得 KUNPENG COMPATIBLE 证书。

整个系列的组件关系如下：

应用程序 → INFINI Gateway（流量入口） → Easysearch（数据存储与检索）

有了 Gateway，你就可以更放心地将搜索服务开放给更多应用和用户，而不必过度担心安全与性能失控问题。

二、部署前置条件

1. 信创环境

CPU ：鲲鹏 Kunpeng-920、aarch64
操作系统：统信服务器操作系统A版 V20

2. 确保 Easysearch 已正常运行

Gateway 本身不存储数据，核心职责是代理与增强 Easysearch。因此部署前请先确认 Easysearch 已启动，并且网络可达：

curl -ku admin:你的密码 https://localhost:9200

三、部署步骤

步骤 1：下载 INFINI Gateway

下面脚本会自动下载对应平台的 Gateway 最新版本，并解压到 /opt/gateway：

# 一键下载并安装到 /opt/gateway
curl -sSL http://get.infini.cloud | bash -s -- -p gateway -d /opt/gateway

步骤 2：编写 Gateway 配置文件

Gateway 启动依赖 YAML 配置文件，用来声明监听端口、后端 Easysearch 地址和认证信息。进入安装目录后，找到 gateway.yml 并按实际环境修改：

# 按实际情况填写可访问的 Easysearch 地址
LOGGING_ES_ENDPOINT:https://localhost:9200/

LOGGING_ES_USER:admin

LOGGING_ES_PASS:"你的 Easysearch 密码"

# 按实际情况填写可访问的 Easysearch 地址
PROD_ES_ENDPOINT:https://localhost:9200/

PROD_ES_USER:admin

PROD_ES_PASS:"你的 Easysearch 密码"

# 按需设置 Gateway 对外监听端口
GW_BINDING:"0.0.0.0:8000"

步骤 3：启动 Gateway

进入 Gateway 安装目录，执行下面命令启动程序：

# 进入安装目录
cd /opt/gateway

# 运行程序（gateway-linux-arm64 为可执行文件名）
./gateway-linux-arm64

程序启动后，即可通过配置端口访问 Easysearch 服务。

在前台运行模式下，如需停止 Gateway，按 Ctrl+C 即可。

如果希望将 Gateway 作为后台服务运行，可执行：

# 命令中的 gateway-linux-arm64 为可执行文件名
./gateway-linux-arm64 -service install && ./gateway-linux-arm64 -service start

如需卸载服务，执行以下命令：

./gateway-linux-arm64 -service stop

./gateway-linux-arm64 -service uninstall

步骤 4：验证 Gateway 是否正常工作

通过 Gateway 间接访问 Easysearch，确认转发通路正常：

# 通过 Gateway（8000 端口）访问 Easysearch
curl http://0.0.0.0:8000

# 对比直连 Easysearch 的结果
curl -ku admin:你的密码 https://localhost:9200

两条命令返回的 JSON 结果应基本一致。若都能正常响应，说明 Gateway 已成功接管 Easysearch 的访问入口。

如果在部署过程中遇到问题，欢迎查阅官方文档。祝你部署顺利！

作者：小袁
原文：https://infinilabs.cn/blog/2026/gateway-install-at-xc-platform/

INFINI Labs 产品更新 | Coco AI v0.9 与 Easysearch v2.0 全新功能上线，全面支持 GitLab 合并请求（MR）自动 AI Review

资讯动态 • INFINI Labs 小助手发表了文章 • 0 个评论 • 10579 次浏览 • 2025-11-24 00:24 • 来自相关话题

Coco AI v0.9

Coco AI 本次详细更新记录如下：

Coco AI 客户端 v0.9

🚀 功能特性 (Features)

feat: 支持通过快捷键切换分组 #911
feat: 支持从设置页面打开日志文件夹
feat: 支持使用 home 和 end 键移动光标
feat: 支持使用 page up 和 page down 键移动选中条
feat: 规范化多级菜单的标签结构
feat: 当父插件类型为 Extension 时，搜索父插件可以搜到子插件
feat: 支持使用 modifier key 和回车对话 AI 助手
feat: 允许在光标位于开头时返回
feat(插件兼容性): 插件描述文件添加 minimum_coco_version 字段进行版本检查
feat: 实现紧凑窗口模式
feat: 实现设置项搜索延迟和本地搜索结果权重
feat: 添加主窗口透明度设置
feat: 添加从默认模式回答紧凑模式的延迟设置

✈️ 改进优化 (Improvements)

refactor: 优化搜索结果的排序逻辑 #910
style: 为图片添加深色投影 #912
chore: 为 Web 组件添加跨域配置 #921
refactor: 若 AXUIElementSetAttributeValue() 失败则进行重试 #924
refactor(calculator): 若表达式为 "num => num" 格式则跳过计算 #929
chore: 使用自定义日志目录 #930
chore: 将 tauri_nspanel 升级至 v2.1 #933
refactor: show_coco/hide_coco 现已在 macOS 上改用 NSPanel 的相关方法 #933
refactor: 将 convert_pages() 流程封装为函数 #934
refactor(post-search): 从每个查询源至少收集 2 份文档 #948
refactor: custom_version_comparator() 现已支持语义化版本比较 #941
chore: 让主窗口垂直居中 #959
refactor(view extension): 通过本地 HTTP 服务器加载 HTML/资源文件 #973

🐛 问题修复(Bug Fixes)

fix: 修复服务列表自动更新的问题 #913
ix: 修复聊天内容重复的问题 #916
fix: 修复固定窗口（Pinned Window）快捷键失效的问题 #917
fix: 修复从另一显示器操作焦点窗口时，窗口管理扩展失效的问题 #919
fix(窗口管理插件): 修复“下一个/上一个桌面”功能失效的问题 #926
fix: 修复页面频繁闪烁的问题 #935
fix(view extension): 修复通过快捷键打开扩展时搜索栏 UI 显示异常的问题 #938
fix: 修复全选文本后无法删除的问题 #943
fix: 修复在聊天和搜索页面之间切换时的抖动问题 #955
fix: 修复重复显示登录成功提示的问题 #977
fix: 修复 Quick AI 无法继续对话的问题 #979

Coco App 相关截图：

Coco AI 服务端 v0.9

💥 重大变更(Breaking Changes)

refactor: 将连接器重构为基于流水线（Pipeline）模式 (#545) #545
refactor: 重新实现安全功能；需重新运行设置程序

🚀 功能特性 (Features)

feat: 新增 Neo4j 连接器 #539
feat: 新增内置商店 #551
feat: 基于 RBAC 的安全机制
feat: 用户级数据所有权与共享功能
feat: 管理界面增加权限校验
feat: 新增路由权限验证
feat: 新增用户实体卡片
feat: 文档管理增加视图功能
feat: 新增 Webhooks 管理界面 (#558)
feat: 新增 GitLab 合并事件的 Webhook 处理器
feat: 集成扩展商店
feat: 支持编辑连接器处理器配置
feat: 支持配置 Base Path 以自定义服务端点
feat: 名称字段增加拼音支持
feat: 新增 MongoDB 连接器

🐛 问题修复(Bug Fixes)

fix: 修复切换扩展类型后重置搜索关键词的问题
fix: 修复全屏小部件的相关问题

✈️ 改进优化 (Improvements)

refactor: 为深色模式添加悬停背景效果
chore: 修复文档搜索功能
chore: 格式化日期
refactor: 更新初始值
chore: 修复数据源名称缺失的问题
chore: 安装完成后隐藏弹窗
chore: 基于框架变更进行重构
chore: 为支持深度思考（DeepThink）获取更多文档 #577
chore: 启用搜索后将首页更改为搜索页 #541
chore: 更新搜索 API 以支持查询 DSL #550
chore: 默认按创建时间排序
chore: 调整多语言配置
chore: 用户表单增加确认密码字段
chore: 调整连接器类型
chore: 调整连接器 OAuth 重定向设置
refactor: 为集成功能进行重构
refactor: 移除集成配置中的 Token
chore: 编辑用户时禁用邮箱字段
chore: 调整搜索设置

Coco Server 相关截图：

Easysearch v2.0

Easysearch 本次更新如下：

💥 重大变更(Breaking Changes)

正式发布 Easysearch 2.0 版本，底层 Lucene 更新到 9.12.2
新增 ui 插件，为 Easysearch 提供了轻量级界面化管理功能，不再依赖第三方对集群进行管理，真正做到开箱即用

🚀 功能特性 (Features)

兼容 1.15.x 版本的索引，可无缝升级
新增 UI 插件，涵盖从集群，节点，索引，到分片等不同维度的监控和管理功能
支持关闭 security 进入 UI

✈️ 改进优化 (Improvements)

range 查询，按数字类型字段排序，相比旧版本效率大幅提升

Easysearch UI 相关截图：

Console v1.30

Console 本次详细更新记录如下：

🚀 功能特性 (Features)

feat: 支持百分比聚合
feat: 为初始化管理员用户增加密码强度校验 (#250)
feat: 支持 Nginx 代理下的子目录路径 (#243)

🐛 问题修复(Bug Fixes)

fix: 修复了索引映射 (mapping) 在滚动查询 (scroll) 后不正确的问题 (#248)
fix: 修复索引 mapping 在滚动操作之后不对的问题
fix: 修复集群监控设置显示错误

✈️ 改进优化 (Improvements)

chore: 删除集群后减少 Agent 上报异常错误日志输出 (#258)
此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Console 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Console 受益。

Gateway v1.30

Gateway 本次更新如下：

🚀 功能特性 (Features)

feat(rewrite_to_bulk)：使文档更新兼容 Elasticsearch 6.x (#112)

🐛 问题修复(Bug Fixes)

fix: 修复心跳连接的潜在泄漏问题 (#107)

✈️ 改进优化 (Improvements)

改进 ReverseProxy 的锁机制和节点发现逻辑 (#111)
此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Gateway 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Gateway 受益。

Agent v1.30

Agent 本次更新如下：

🚀 功能特性 (Features)

在 Kubernetes 环境下通过环境变量 http.port 探测 Easysearch 的 HTTP 端口

✈️ 改进优化 (Improvements)

此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Agent 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Agent 受益。

Loadgen v1.30

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

✈️ 改进优化 (Improvements)

此版本包含了底层 Framework v1.3 的更新，解决了一些常见问题，并增强了整体稳定性和性能。虽然 Loadgen 本身没有直接的变更，但从 Framework 中继承的改进间接地使 Loadgen 受益。

Framework 1.3.0

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

🚀 功能特性 (Features)

feat: add delete by query v2 #194
feat: support aggregation queries in orm
feat: add support for query_string query
feat: allow to read http request body multi-times #212
feat: add support for Elasticsearch cat allocation API
feat: support custom write operation type for indexing_merge processor
feat: add util to parse time with local timezone #217
feat: add PKCS#12 certificate support for http client config
feat: add security module, with rbac,sharing,oauth client etc.
feat: add entity_card module
feat: add abstract layer for user or teams search
feat: add util to normalize folder path
feat: add some string utils
feat: allow force update all mappings for existing indices
feat: add several http filters
feat: add util to execute http requests via curl

🐛 问题修复 (Bug Fixes)

fix: localhost/127.0.0.1 with noproxy #185
fix: cluster metadata lost #200
fix: fix security permission cache
fix: fix incorrect queue capacity check

✈️ 改进 (Improvements)

chore: less logging for session store change #180
refactor: initialize index schema using index template
chore: add generate secure string util func #183
chore: add validate secure func #184
refactor: refactoring security structs #191
refactor: refactoring schema init logic, disable index based template #188
chore: use safe special chars #190
chore: reduce log with agent #193
chore: add util to register http handler #206
chore: allow access application settings for ui #209
refactor: refactoring query string parser #216
chore: update default fuzziness to 3 #215
chore: avoid using same session name for mulit instances #221
refactor: refactoring pipeline #222
chore: enhance bulk indexing - stricter offset validation and improved error handling #224
refactor: refactoring http utils #226
refactor: refactoring search response, add score support
refactor: refactoring ORM module, add generic security hooks
refactor: add boolean query to orm query builder
refactor: refactoring access_token, simplify login info
refactor: move RegisterAllowOriginFunc to core

更多详情请查看以下各产品的 Release Notes 或联系我们的技术支持团队！

期待反馈

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

官网：https://infinilabs.cn

【搜索客社区日报】第2119期 (2025-09-22）

社区日报 • Muses 发表了文章 • 0 个评论 • 12448 次浏览 • 2025-09-22 13:44 • 来自相关话题

如何使用极限网关实现 Elasticsearch 集群迁移至 Easysearch

Elasticsearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 21060 次浏览 • 2025-09-21 14:50 • 来自相关话题

之前有博客介绍过通过 Reindex 的方法将 Elasticsearch 的数据迁移到 Easysearch 集群，今天再介绍一个方法，通过极限网关（INFINI Gateway）来进行数据迁移。

测试环境

软件	版本
Easysearch	1.12.0
Elasticsearch	7.17.29
INFINI Gateway	1.29.2

迁移步骤

选定要迁移的索引
在目标集群建立索引的 mapping 和 setting
准备 INFINI Gateway 迁移配置
运行 INFINI Gateway 进行数据迁移

迁移实战

选定要迁移的索引

在 Elasticsearch 集群中选择目标索引：infinilabs 和 test1，没错，我们一次可以迁移多个。

在 Easysearch 集群使用源索引的 setting 和 mapping 建立目标索引。（略）
INFINI Gateway 迁移配置准备

去 github 下载配置，修改下面的连接集群的部分

  1 env:
  2   LR_GATEWAY_API_HOST: 127.0.0.1:2900
  3   SRC_ELASTICSEARCH_ENDPOINT: http://127.0.0.1:9200
  4   DST_ELASTICSEARCH_ENDPOINT: http://127.0.0.1:9201
  5 path.data: data
  6 path.logs: log
  7 progress_bar.enabled: true
  8 configs.auto_reload: true
  9
 10 api:
 11   enabled: true
 12   network:
 13     binding: $[[env.LR_GATEWAY_API_HOST]]
 14
 15 elasticsearch:
 16   - name: source
 17     enabled: true
 18     endpoint: $[[env.SRC_ELASTICSEARCH_ENDPOINT]]
 19     basic_auth:
 20       username: elastic
 21       password: goodgoodstudy
 22
 23   - name: target
 24     enabled: true
 25     endpoint: $[[env.DST_ELASTICSEARCH_ENDPOINT]]
 26     basic_auth:
 27       username: admin
 28       password: 14da41c79ad2d744b90c

pipeline 部分修改要迁移的索引名称，我们迁移 infinilabs 和 test1 两个索引。

 31 pipeline:
 32   - name: source_scroll
 33     auto_start: true
 34     keep_running: false
 35     processor:
 36       - es_scroll:
 37           slice_size: 1
 38           batch_size: 5000
 39           indices: "infinilabs,test1"
 40           elasticsearch: source
 41           output_queue: source_index_dump
 42           partition_size: 1
 43           scroll_time: "5m"

迁移数据

./gateway-mac-arm64

#如果你保存的配置文件名称不叫 gateway.yml，则需要加参数 -config 文件名

数据导入完成后，网关 ctrl+c 退出。

至此，数据迁移就完成了。下一篇我们来介绍 INFINI Gateway 的数据比对功能。

有任何问题，欢迎加我微信沟通。

关于极限网关（INFINI Gateway）

官网文档：https://docs.infinilabs.com/gateway
开源地址：https://github.com/infinilabs/gateway

ES 调优帖：Gateway 批量写入性能优化实践

Elasticsearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 18905 次浏览 • 2025-08-06 17:32 • 来自相关话题

背景：bulk 优化的应用

Gateway 的优化点

bulk 的优化理念是将日常零散的写入需求做集中化的处理，尽量减低日常请求的损耗，完成资源最大化的利用。简而言之就是“好钢用在刀刃上”。

gateway 的写入加速则对 bulk 的优化理念的最大化补全。

gateway 可以本地计算每个索引文档对应后端 Elasticsearch 集群的目标存放位置，从而能够精准的进行写入请求定位。

整理的优化思路如下图：

优化实践

那我们来实践一下，看看 gateway 能提升多少的写入。

这里我们分 2 个测试场景：

基础集中写入测试，不带文档 id，直接批量写入。这个场景更像是日志或者监控数据采集的场景。
带文档 id 的写入测试，更偏向搜索场景或者大数据批同步的场景。

2 个场景都进行直接写入 ES 和 gateway 转发 ES 的效率比对。

测试材料除了需要备一个网关和一套 es 外，其余的内容如下：

测试索引 mapping 一致，名称区分：

PUT gateway_bulk_test
{
  "settings": {
    "number_of_shards": 6,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "timestamp": {
        "type": "date",
        "format": "strict_date_optional_time"
      },
      "field1": {
        "type": "keyword"
      },
      "field2": {
        "type": "keyword"
      },
      "field3": {
        "type": "keyword"
      },
      "field4": {
        "type": "integer"
      },
      "field5": {
        "type": "keyword"
      },
      "field6": {
        "type": "float"
      }
    }
  }
}

PUT bulk_test
{
  "settings": {
    "number_of_shards": 6,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "timestamp": {
        "type": "date",
        "format": "strict_date_optional_time"
      },
      "field1": {
        "type": "keyword"
      },
      "field2": {
        "type": "keyword"
      },
      "field3": {
        "type": "keyword"
      },
      "field4": {
        "type": "integer"
      },
      "field5": {
        "type": "keyword"
      },
      "field6": {
        "type": "float"
      }
    }
  }
}

gateway 的配置文件如下：

path.data: data
path.logs: log

entry:
  - name: my_es_entry
    enabled: true
    router: my_router
    max_concurrency: 200000
    network:
      binding: 0.0.0.0:8000

flow:
  - name: async_bulk
    filter:
      - bulk_reshuffle:
          when:
            contains:
              _ctx.request.path: /_bulk
          elasticsearch: prod
          level: node
          partition_size: 1
          fix_null_id: true
      - elasticsearch:
          elasticsearch: prod #elasticsearch configure reference name
          max_connection_per_node: 1000 #max tcp connection to upstream, default for all nodes
          max_response_size: -1 #default for all nodes
          balancer: weight
          refresh: # refresh upstream nodes list, need to enable this feature to use elasticsearch nodes auto discovery
            enabled: true
            interval: 60s
          filter:
            roles:
              exclude:
                - master

router:
  - name: my_router
    default_flow: async_bulk

elasticsearch:
  - name: prod
    enabled: true
    endpoints:
      - https://127.0.0.1:9221
      - https://127.0.0.1:9222
      - https://127.0.0.1:9223
    basic_auth:
      username: admin
      password: admin

pipeline:
  - name: bulk_request_ingest
    auto_start: true
    keep_running: true
    retry_delay_in_ms: 1000
    processor:
      - bulk_indexing:
          max_connection_per_node: 100
          num_of_slices: 3
          max_worker_size: 30
          idle_timeout_in_seconds: 10
          bulk:
            compress: false
            batch_size_in_mb: 10
            batch_size_in_docs: 10000
          consumer:
            fetch_max_messages: 100
          queue_selector:
            labels:
              type: bulk_reshuffle

测试脚本如下：

#!/usr/bin/env python3
"""
ES Bulk写入性能测试脚本

"""

import hashlib
import json
import random
import string
import time
from typing import List, Dict, Any

import requests
from concurrent.futures import ThreadPoolExecutor
from datetime import datetime
import urllib3

# 禁用SSL警告
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

class ESBulkTester:
    def __init__(self):
        # 配置变量 - 可修改
        self.es_configs = [
            {
                "name": "ES直连",
                "url": "https://127.0.0.1:9221",
                "index": "bulk_test",
                "username": "admin",  # 修改为实际用户名
                "password": "admin",  # 修改为实际密码
                "verify_ssl": False  # HTTPS需要SSL验证
            },
            {
                "name": "Gateway代理",
                "url": "http://localhost:8000",
                "index": "gateway_bulk_test",
                "username": None,  # 无需认证
                "password": None,
                "verify_ssl": False
            }
        ]
        self.batch_size = 10000  # 每次bulk写入条数
        self.log_interval = 100000  # 每多少次bulk写入输出日志

        # ID生成规则配置 - 前2位后5位
        self.id_prefix_start = 1
        self.id_prefix_end = 999      # 前3位: 01-999
        self.id_suffix_start = 1
        self.id_suffix_end = 9999   # 后4位: 0001-9999

        # 当前ID计数器
        self.current_prefix = self.id_prefix_start
        self.current_suffix = self.id_suffix_start

    def generate_id(self) -> str:
        """生成固定规则的ID - 前2位后5位"""
        id_str = f"{self.current_prefix:02d}{self.current_suffix:05d}"

        # 更新计数器
        self.current_suffix += 1
        if self.current_suffix > self.id_suffix_end:
            self.current_suffix = self.id_suffix_start
            self.current_prefix += 1
            if self.current_prefix > self.id_prefix_end:
                self.current_prefix = self.id_prefix_start

        return id_str

    def generate_random_hash(self, length: int = 32) -> str:
        """生成随机hash值"""
        random_string = ''.join(random.choices(string.ascii_letters + string.digits, k=length))
        return hashlib.md5(random_string.encode()).hexdigest()

    def generate_document(self) -> Dict[str, Any]:
        """生成随机文档内容"""
        return {
            "timestamp": datetime.now().isoformat(),
            "field1": self.generate_random_hash(),
            "field2": self.generate_random_hash(),
            "field3": self.generate_random_hash(),
            "field4": random.randint(1, 1000),
            "field5": random.choice(["A", "B", "C", "D"]),
            "field6": random.uniform(0.1, 100.0)
        }

    def create_bulk_payload(self, index_name: str) -> str:
        """创建bulk写入payload"""
        bulk_data = []

        for _ in range(self.batch_size):
            #doc_id = self.generate_id()
            doc = self.generate_document()

            # 添加index操作
            bulk_data.append(json.dumps({
                "index": {
                    "_index": index_name,
            #        "_id": doc_id
                }
            }))
            bulk_data.append(json.dumps(doc))

        return "\n".join(bulk_data) + "\n"

    def bulk_index(self, config: Dict[str, Any], payload: str) -> bool:
        """执行bulk写入"""
        url = f"{config['url']}/_bulk"
        headers = {
            "Content-Type": "application/x-ndjson"
        }

        # 设置认证信息
        auth = None
        if config.get('username') and config.get('password'):
            auth = (config['username'], config['password'])

        try:
            response = requests.post(
                url,
                data=payload,
                headers=headers,
                auth=auth,
                verify=config.get('verify_ssl', True),
                timeout=30
            )
            return response.status_code == 200
        except Exception as e:
            print(f"Bulk写入失败: {e}")
            return False

    def refresh_index(self, config: Dict[str, Any]) -> bool:
        """刷新索引"""
        url = f"{config['url']}/{config['index']}/_refresh"

        # 设置认证信息
        auth = None
        if config.get('username') and config.get('password'):
            auth = (config['username'], config['password'])

        try:
            response = requests.post(
                url,
                auth=auth,
                verify=config.get('verify_ssl', True),
                timeout=10
            )
            success = response.status_code == 200
            print(f"索引刷新{'成功' if success else '失败'}: {config['index']}")
            return success
        except Exception as e:
            print(f"索引刷新失败: {e}")
            return False

    def run_test(self, config: Dict[str, Any], round_num: int, total_iterations: int = 100000):
        """运行性能测试"""
        test_name = f"{config['name']}-第{round_num}轮"
        print(f"\n开始测试: {test_name}")
        print(f"ES地址: {config['url']}")
        print(f"索引名称: {config['index']}")
        print(f"认证: {'是' if config.get('username') else '否'}")
        print(f"每次bulk写入: {self.batch_size}条")
        print(f"总计划写入: {total_iterations * self.batch_size}条")
        print("-" * 50)

        start_time = time.time()
        success_count = 0
        error_count = 0

        for i in range(1, total_iterations + 1):
            payload = self.create_bulk_payload(config['index'])

            if self.bulk_index(config, payload):
                success_count += 1
            else:
                error_count += 1

            # 每N次输出日志
            if i % self.log_interval == 0:
                elapsed_time = time.time() - start_time
                rate = i / elapsed_time if elapsed_time > 0 else 0
                print(f"已完成 {i:,} 次bulk写入, 耗时: {elapsed_time:.2f}秒, 速率: {rate:.2f} bulk/秒")

        end_time = time.time()
        total_time = end_time - start_time
        total_docs = total_iterations * self.batch_size

        print(f"\n{test_name} 测试完成!")
        print(f"总耗时: {total_time:.2f}秒")
        print(f"成功bulk写入: {success_count:,}次")
        print(f"失败bulk写入: {error_count:,}次")
        print(f"总文档数: {total_docs:,}条")
        print(f"平均速率: {success_count/total_time:.2f} bulk/秒")
        print(f"文档写入速率: {total_docs/total_time:.2f} docs/秒")
        print("=" * 60)

        return {
            "test_name": test_name,
            "config_name": config['name'],
            "round": round_num,
            "es_url": config['url'],
            "index": config['index'],
            "total_time": total_time,
            "success_count": success_count,
            "error_count": error_count,
            "total_docs": total_docs,
            "bulk_rate": success_count/total_time,
            "doc_rate": total_docs/total_time
        }

    def run_comparison_test(self, total_iterations: int = 10000):
        """运行双地址对比测试"""
        print("ES Bulk写入性能测试开始")
        print(f"测试时间: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
        print("=" * 60)

        results = []
        rounds = 2  # 每个地址测试2轮

        # 循环测试所有配置
        for config in self.es_configs:
            print(f"\n开始测试配置: {config['name']}")
            print("*" * 40)

            for round_num in range(1, rounds + 1):
                # 运行测试
                result = self.run_test(config, round_num, total_iterations)
                results.append(result)

                # 每轮结束后刷新索引
                print(f"\n第{round_num}轮测试完成，执行索引刷新...")
                self.refresh_index(config)

                # 重置ID计数器
                if round_num == 1:
                    # 第1轮：使用初始ID范围（新增数据）
                    print("第1轮：新增数据模式")
                else:
                    # 第2轮：重复使用相同ID（更新数据模式）
                    print("第2轮：数据更新模式，复用第1轮ID")
                    self.current_prefix = self.id_prefix_start
                    self.current_suffix = self.id_suffix_start

                print(f"{config['name']} 第{round_num}轮测试结束\n")

        # 输出对比结果
        print("\n性能对比结果:")
        print("=" * 80)

        # 按配置分组显示结果
        config_results = {}
        for result in results:
            config_name = result['config_name']
            if config_name not in config_results:
                config_results[config_name] = []
            config_results[config_name].append(result)

        for config_name, rounds_data in config_results.items():
            print(f"\n{config_name}:")
            total_time = 0
            total_bulk_rate = 0
            total_doc_rate = 0

            for round_data in rounds_data:
                print(f"  第{round_data['round']}轮:")
                print(f"    耗时: {round_data['total_time']:.2f}秒")
                print(f"    Bulk速率: {round_data['bulk_rate']:.2f} bulk/秒")
                print(f"    文档速率: {round_data['doc_rate']:.2f} docs/秒")
                print(f"    成功率: {round_data['success_count']/(round_data['success_count']+round_data['error_count'])*100:.2f}%")

                total_time += round_data['total_time']
                total_bulk_rate += round_data['bulk_rate']
                total_doc_rate += round_data['doc_rate']

            avg_bulk_rate = total_bulk_rate / len(rounds_data)
            avg_doc_rate = total_doc_rate / len(rounds_data)

            print(f"  平均性能:")
            print(f"    总耗时: {total_time:.2f}秒")
            print(f"    平均Bulk速率: {avg_bulk_rate:.2f} bulk/秒")
            print(f"    平均文档速率: {avg_doc_rate:.2f} docs/秒")

        # 整体对比
        if len(config_results) >= 2:
            config_names = list(config_results.keys())
            config1_avg = sum([r['bulk_rate'] for r in config_results[config_names[0]]]) / len(config_results[config_names[0]])
            config2_avg = sum([r['bulk_rate'] for r in config_results[config_names[1]]]) / len(config_results[config_names[1]])

            if config1_avg > config2_avg:
                faster = config_names[0]
                rate_diff = config1_avg - config2_avg
            else:
                faster = config_names[1]
                rate_diff = config2_avg - config1_avg

            print(f"\n整体性能对比:")
            print(f"{faster} 平均性能更好，bulk速率高 {rate_diff:.2f} bulk/秒")
            print(f"性能提升: {(rate_diff/min(config1_avg, config2_avg)*100):.1f}%")

def main():
    """主函数"""
    tester = ESBulkTester()

    # 运行测试（每次bulk 1万条，300次bulk = 300万条文档）
    tester.run_comparison_test(total_iterations=300)

if __name__ == "__main__":
    main()

1. 日志场景：不带 id 写入

测试条件：

bulk 写入数据不带文档 id
每批次 bulk 10000 条数据，总共写入 30w 数据

这里把

反馈结果：

性能对比结果:
================================================================================

ES直连:
  第1轮:
    耗时: 152.29秒
    Bulk速率: 1.97 bulk/秒
    文档速率: 19699.59 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 152.29秒
    平均Bulk速率: 1.97 bulk/秒
    平均文档速率: 19699.59 docs/秒

Gateway代理:
  第1轮:
    耗时: 115.63秒
    Bulk速率: 2.59 bulk/秒
    文档速率: 25944.35 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 115.63秒
    平均Bulk速率: 2.59 bulk/秒
    平均文档速率: 25944.35 docs/秒

整体性能对比:
Gateway代理 平均性能更好，bulk速率高 0.62 bulk/秒
性能提升: 31.7%

2. 业务场景：带文档 id 的写入

测试条件：

bulk 写入数据带有文档 id，两次测试写入的文档 id 生成规则一致且重复。
每批次 bulk 10000 条数据，总共写入 30w 数据

这里把 py 脚本中第 99 行和第 107 行的注释打开。

反馈结果：

性能对比结果:
================================================================================

ES直连:
  第1轮:
    耗时: 155.30秒
    Bulk速率: 1.93 bulk/秒
    文档速率: 19317.39 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 155.30秒
    平均Bulk速率: 1.93 bulk/秒
    平均文档速率: 19317.39 docs/秒

Gateway代理:
  第1轮:
    耗时: 116.73秒
    Bulk速率: 2.57 bulk/秒
    文档速率: 25700.06 docs/秒
    成功率: 100.00%
  平均性能:
    总耗时: 116.73秒
    平均Bulk速率: 2.57 bulk/秒
    平均文档速率: 25700.06 docs/秒

整体性能对比:
Gateway代理 平均性能更好，bulk速率高 0.64 bulk/秒
性能提升: 33.0%

小结

不管是日志场景还是业务价值更重要的大数据或者搜索数据同步场景， gateway 的写入加速都能平稳的节省 25%-30% 的写入耗时。

关于极限网关（INFINI Gateway）

官网文档：https://docs.infinilabs.com/gateway
开源地址：https://github.com/infinilabs/gateway

作者：金多安，极限科技（INFINI Labs）搜索运维专家，Elastic 认证专家，搜索客社区日报责任编辑。一直从事与搜索运维相关的工作，日常会去挖掘 ES / Lucene 方向的搜索技术原理，保持搜索相关技术发展的关注。
原文：https://infinilabs.cn/blog/2025/gateway-bulk-write-performance-optimization/

INFINI Labs 产品更新 | Coco AI – 增强 AI 搜索、API 管理与性能优化等

资讯动态 • INFINI Labs 小助手发表了文章 • 0 个评论 • 4375 次浏览 • 2025-03-15 18:21 • 来自相关话题

INFINI Labs 产品更新发布！此次更新涵盖 Coco AI 、Easysearch 等产品多项重要升级，重点提升 AI 搜索能力、易用性及企业级优化。

Coco AI v0.2 作为开源、跨平台的 AI 搜索工具，新增 APP 自动更新提示、API Token 管理、文档处理优化等功能。
INFINI Easysearch v1.11.1 集成 AI 向量搜索，优化查询聚合能力。
INFINI Console、Gateway、Agent、Loadgen、Framework 关键问题修复，优化 WebSocket 处理与整体用户体验。
Coco AI Server 增强 WebSocket 会话处理、支持 RAG 会话和动态配置，并新增图形化管理界面。

Coco AI v0.2

Coco AI 本次详细更新记录如下：

Coco AI 客户端 v0.2.1

功能更新

支持 APP 应用内更新提示并可自动更新

问题修复

修复融合搜索包含已禁用服务器的问题
修复版本类型不正确：应为字符串而不是 u32
修复聊天推送结束的判断类型不准确问题

优化改进

重构了聊天组件
添加服务链接展示
优化了聊天滚动效果和聊天数据渲染效果
设置聊天窗口最小宽度 & 移除输入框背景
移除废弃的选中功能 & 添加选择隐藏 APP 功能
Websocket 超时增加到 2 分钟

Coco AI 服务端 v0.2.2

功能更新

新增图形化管理界面
新增数据源下文档创建 API
新增文件上传相关 API
新增 API TOKEN 管理相关 API
数据源同步支持动态配置时间间隔
支持动态更新服务端设置
支持动态更新大模型相关设置
新增 RAG 聊天会话处理
新增联网搜索能力
支持对接 Deepseek 大模型
新增文档预处理 Processor

问题修复

修复 Google Drive Connector 缺少文件报错

优化改进

优化聊天会话功能
优化 Websocket 会话管理
优化登录退出接口
保存 Notion 其它内容到 Payload 字段
完善后台任务退出机制
优化默认索引模版和查询模版

INFINI Easysearch v1.11.1

Easysearch 本次更新如下：

功能更新

新增 AI 模块，集成 Ollama embedding API，支持文本向量化

问题修复

修复 DateRange 聚合在 Rollup 查询中无法正确合并的问题

优化改进

针对用户使用体验进行了多项改进，包括：

弃用 KNN 模块中的 index.knn 配置项，（此配置项和其他功能经常发生冲突）简化配置逻辑，该配置项将在后续版本中移除
将 KNN 搜索功能从插件形式集成为内置功能，无需额外安装即可使用
将跨集群复制（CCR）功能从插件形式集成为内置功能，开箱即用
优化索引配置更新验证：增加非动态配置项的值比对，避免误报

INFINI Console v1.29.1

Console 在线体验：

http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

问题修复

修复 agentless 模式下计算索引级别实时 QPS 不准确的问题

INFINI Gateway v1.29.1

Gateway 本次更新如下：

优化改进

同步更新 Framework v1.1.4 优化了一些已知问题

INFINI Agent v1.29.1

Agent 本次更新如下：

优化改进

同步更新 Framework v1.1.4 优化了一些已知问题

INFINI Loadgen v1.29.1

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

优化改进

同步更新 Framework v1.1.4 优化了一些已知问题

INFINI Framework v1.1.4

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

功能更新

添加配置选项，以在 WebSocket 连接期间禁用回显消息
允许在 WebSocket 连接/断开时注册回调函数
为 API 添加可选的登录验证配置

优化改进

停止任务后取消任务
回调发生错误时关闭 WebSocket 连接

更多详情请查看以下详细的 Release Notes 或联系我们的技术支持团队！

期待反馈

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

官网：https://infinilabs.cn

INFINI Labs 产品更新 | Console/Gateway/Agent 等产品开源发布首个版本

资讯动态 • INFINI Labs 小助手发表了文章 • 1 个评论 • 4579 次浏览 • 2024-12-27 16:11 • 来自相关话题

INFINI Easysearch v1.9.0

Easysearch 本次更新如下：

Improvements

发布 rollup 功能
- 支持自动对 rollup 索引进行滚动，无需外部触发
- 支持 avg sum max min value_count percentiles 指标类型的聚合
- 支持 terms 聚合
- 支持对指标聚合进行 Pipeline 聚合
- 支持聚合前先对数据进行过滤
- 进行聚合查询时支持直接搜索原始索引，不用更改搜索代码
增加适配 logstash 8.x 的请求 header
_cat/templates 增加 lifecycle 和 rollover 列的展示

Bug fix

修复 rest-api template 测试错误

INFINI Console v1.27.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Improvements

代码开源，统一采用 Github 仓库进行开发
指标采集优化，由原来的单一协程采集调整为每个注册的集群有单独的协程进行采集
指标监控页面图表展示采用懒加载、单个图表独立加载，增强用户体验
通用时间控件增加超时时间设置
集群选择控件增加注册、刷新功能
提供指标采集状态
表格控件排版优化

Bug fix

修复集群元数据更新不及时问题
修复帮助文档等链接不正确问题
修复节点、索引数据因随机 id 出现重复记录问题
修复 Runtime、Agent 实例编辑页面出错问题
修复集群、节点、索引、分片元数据无 Loading 问题
修复索引健康状态指标采集失败问题
修复个别菜单列未国际化问题

INFINI Gateway v1.27.0

Gateway 本次更新如下：

Improvements

调整队列消费者 slice 默认配置为 1

Bug fix

修复缓存数据丢失导致队列无法消费问题
同步更新 Framework 修复的一些已知问题

INFINI Agent v1.27.0

探针 Agent 本次更新如下：

Improvements

与 INFINI Console 统一版本号
同步更新 Framework 修复的已知问题
支持 K8S 环境指标采集

INFINI Loadgen v1.27.0

Loadgen 本次更新如下：

Improvements

保持与 Console 相同版本
同步更新 Framework 修复的已知问题

Bug fix

修复 API 接口测试逻辑异常问题

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的核心公共代码库。开源地址：https://github.com/infinilabs/framework

Improvements

发布 1.0.0 Release 版本

期待反馈

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

官网：https://infinilabs.cn

INFINI Labs 助力开源与教育：免费许可证计划全面升级

开源项目 • INFINI Labs 小助手发表了文章 • 0 个评论 • 4416 次浏览 • 2024-06-19 17:21 • 来自相关话题

免费许可证计划

一、产品实力与荣誉

1.INFINI Pizza：实时搜索的新纪元

在第十三届“数据技术嘉年华”（DTC2024）上，INFINI Labs 发布了划时代的搜索引擎——INFINI Pizza，标志着搜索型数据库迈入实时搜索的新纪元。
INFINI Pizza 凭借先进的设计理念与架构，以及独有的专利技术，实现了对海量数据的无限伸缩，提供高效、准确的实时数据搜索能力

2.行业标杆案例

INFINI Labs 荣获中国信通院大数据“星河”标杆案例，其中移动云搜索数据库案例更是荣选为数据库标杆案例。
该案例基于移动云 Easysearch 数据库，通过创新的多集群协同模式，实现了数据高性能存取，展现出极高的经济价值与社会价值。

3.国家发明专利认可

INFINI Labs 的多项自主研发技术获得国家发明专利授权，这些成果彰显了公司在大数据领域的技术实力与创新精神。

二、品牌与行业地位

INFINI Labs 作为搜索型数据库产品领域的领军企业，积极参与行业标准的制定与推动。
其核心产品 INFINI Easysearch 荣获信通院首批可信搜索型数据库产品证书，再次印证了公司在行业中的领先地位。

三、产品介绍

Products

INFINI Easysearch：作为 Elasticsearch 的国产化替代方案，提供高度兼容性与卓越性能，满足企业级需求。
INFINI Console：轻量级多集群、跨版本搜索基础设施统一管控平台，助力企业高效管理搜索集群。
INFINI Gateway：专为 Elasticsearch 打造的高性能应用网关，提供丰富的功能特性与卓越性能。
INFINI Loadgen：支持多种搜索引擎的轻量级压测工具，为企业提供强大的数据加载与测试能力。
INFINI Pizza：引领实时搜索时代的新星，为企业提供高效、准确的实时数据搜索解决方案。

四、免费许可证计划

1.教育机构学术许可证

面向全球公立或私立学校、职业学校、大学等教育机构，提供非商业用途的软件使用许可。
有效期一年，符合条件的教育机构可继续申请。

2.开源项目许可证

面向非商业开源项目开发者，要求项目拥有活跃社区并在其官网添加 INFINI Labs 的链接。
许可证免费，有效期一年，符合条件的项目可继续申请。

五、申请方式

符合条件的开源项目和教育机构可通过访问 INFINI Labs 官方网站，轻松提交申请，我们将尽快审核并回复。

申请链接：https://infinilabs.cn/community

六、结语

七、关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

联系我们

原文：https://infinilabs.cn/blog/2024/infini-labs-for-open-source-education-the-free-license-program-upgrades/

极限网关助力好未来 Elasticsearch 容器化升级

Elasticsearch • INFINI Labs 小助手发表了文章 • 0 个评论 • 5393 次浏览 • 2024-06-12 15:01 • 来自相关话题

极限网关在好未来的最佳实践案例，轻松扛住日增百 TB 数据的流量，助力 ES 从物理机到云原生架构的改造，实现了流控、请求分析、安全管理、无缝迁移等场景。一次完美的客户体验~

背景

物理机架构时代

流量特征

图1

降本增效-容器化改造原动力

ES 容器化改造

进行架构升级重点难点- API 服务

原始 ES API 服务痛点

API 访问没有流量控制
可观测性差，而且稳定性一般
版本兼容性差

物理机时代 API 架构

图2

混合时代 API 架构

通过图 3，我们可以看到，极限网关对于版本兼容性很好，能够适配不同的版本。因此，最终选择极限网关作为下一代 ES API 服务方。

图3

里程碑：全部 ES 集群容器化

图4

极限网关实践

下面主要讲述了，为什么选择极限网关，以及极限网关在好未来落地、应用这些内容。

为什么选择极限网关？

学习成本低

我们可以从文档中看到极限网关，其架构简洁，语法简单，直观易懂。学习成本比较低，上手非常快，对新手友好。

性能强悍

经过压测，发现极限网关速度非常快，且针对 Elasticsearch 做了非常细致的优化，能成倍提升写入和查询的速度。

安全性高

支持多种认证方式，最简单的账号密码认证，可以给自定义多个账户密码，大大简化了 Elasticsearch 的安全设置，同时，还可以支持 LDAP 安全验证。

跨版本支持

灵活可扩展

启用安全策略-为 API 服务保驾护航

痛点

极限网关解决问题

强大的过滤功能

在使用 ES 集群过程中，许多场景，需要对请求进行控制、限制等操作。在这方便，感受到了极限网关强大的产品力。比如下面的两个场景

对异常流量进行限流

支持对 IP 限流
支持对 hostname 限流
支持 header 限流

对异常用户进行封禁

- request_user_filter:
    include:
        - "elastic"
    exclude：
        - "Ryan"

总结来讲，主要有这些方面的功能：

图5

优秀的可观测性

痛点

完美解决

使用了极限网关，通过收集请求日志，非常清晰的收集到想要的数据，具体如下：

总体方面：
- 流量曲线
- 状态码占比
- 缓存统计
- 每台网关请求流量
细节方面：
- 打印每次请求语句
- 可以查看请求到具体 ES 节点流量
- 可以查看过滤器的列表

通过下图，我们可以从管理视角直观的看到各种信息，这对于管理员来讲，省时省力，方便快捷。

图6

意外收获：无缝迁移业务 Elasticsearch 上云

由于前期日志业务上云，受到非常好的反馈，多个业务线期望能够上云上服务，达到降本增效的目的。

支持双写

数据可以通过极限网关同时写入两个 ES 集群，能够保障数据完全一致，安全可靠。

无缝切换

切换很丝滑，影响非常小，能够让外界几乎感受不到服务波动。

图7

极限网关流量概览

这是其中一套极限网关的流量统计。用这部分数据进行巡检，一目了然，做到全局的掌控，提高感知力度。

图8

极限网关使用总结

极限网关提供一系列高性能和高可靠性的网关服务。使用这样的服务给我们带来以下好处：

可观测性好：极限网关可以动态的对 Elasticsearch 运行过程中请求进行拦截和分析，通过指标和日志来了解集群运行状态，这些指标可以用于提升性能和业务优化。
增强安全性：包含先进的安全机制，如 basicauth、LDAP 等支持，保护用户数据不受未授权访问和各种网络威胁的侵害。
高稳定性：通过冗余设计和故障转移机制，极限网关能够确保网络服务的高可用性，即使在某些组件发生故障时也能保持服务不中断，单版本最长服务超过 15 个月。
易于管理：通过提供 INFINI Console 简洁直观的管理界面，让用户能够轻松配置和监控网络状态，提升管理效率。
客户支持：良好的客户服务支持可以帮助用户快速解决使用过程中遇到的问题，提供专业的技术指导。

综上所述，极限网关为用户提供了一个高速、安全、稳定且易于管理的 ES 网关，适合对网络性能有较高要求的个人和企业用户。

未来规划

提升 ES 集群效能--新技术应用&&版本升级

极限科技官方推荐的 Easysearch 在压缩率，查询速度等等方面有很多的优势，通过长时间的测试稳定性，新特性，对比云原生的 ES 集群，根据测试结果，给“客户”提供多种选择，这也是工作重点之一。
我们当前使用的 ES 版本是 6.8，已经远远落后于官方版本，今年我们计划在选择合适的集群升级 ES 版本，拥抱更多官方提供的特性。

混合（多）云架构支持

1、扩缩容：满足不同业务灵活适配

图9

2、灾备：紧急情况快速部署，恢复 ES 集群读写

图10

参考文档：

作者：张华勋，前新浪 CDN 研发，工作主要涉及 Mysql、MongoDB、Redis、Elasticsearch、流量调度等组件和系统，以及运维自动化、平台化等工作。现就职于好未来。

关于好未来

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

联系我们

INFINI Labs 产品更新 | Easysearch 1.8.2 发布优化 CCR 性能

Easysearch • liaosy 发表了文章 • 0 个评论 • 5649 次浏览 • 2024-06-09 12:52 • 来自相关话题

以下是本次更新的详细说明。

INFINI Easysearch v1.8.2

Easysearch 本次更新如下：

Bug fix

修复 source_reuse 与 object 字段为 enable: false 时的冲突

Improvements

升级部分依赖包版本，Commons-collections to 3.2.2, Snakeyaml to 2.0
优化 CCR 同步性能及调整 CCR 全局配置参数
优化插件配置命名，去除"plugins."
优化配置文件目录获取命名

INFINI Console v1.26.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复监控数据布局
修复命令存储权限
修复多行请求包含 SQL 语法
修复文档数过亿时换算错误
修复导入低版本 v1.6.0 告警规则缺少字段问题
修复当 buck_size 小于 60 秒时，因指标采集延迟导致指标显示异常问题

INFINI Gateway v1.26.0

Gateway 本次更新如下：

Improvements

feat: add wildcard_domain filter
chore: remove security filter and translog_viewer

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

Improvements

feat: support dynamic app setting
feat: add cluster settings query args
feat: add gateway config
feat: add http interceptor
feat: return host info in info api
feat: add util to convert string to float
feat: use common app setting api to instead of auth setting api
feat: crontab task support multi crontab expression
fix: skip submit empty bulk requests
feat: support ccr api
fix: get latest offset should compare segment first
fix: wrong use of zstd with vfs
fix: prevent close closed channel
fix: panic on error while saving keystore

期待反馈

下载地址： https://www.infinilabs.cn/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

INFINI Labs 产品更新 | Console 1.24.0 操作日志审计功能发布

资讯动态 • liaosy 发表了文章 • 0 个评论 • 4641 次浏览 • 2024-04-28 12:51 • 来自相关话题

INFINI Console v1.24.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Features

用户操作审计日志功能
新增告警规则克隆一键克隆功能，简化重复类型告警的创建

Bug fix

修复普通用户权限 403 问题
修复探针管理表格展开显示错位问题

Improvements

优化开发工具集群选择控件显示位置
优化数据探索查询控件显示宽度
优化数据探索字段统计功能
优化告警规则列表页搜索，支持远程搜索
Discover 左侧字段聚合支持开关控制拉取本地或远程统计值

INFINI Gateway v1.24.0

Gateway 本次更新如下：

Improvements

Refactoring http client tls config
Write field routing to bulk metadata when field _routing exists in scrolled doc

Bug fix

Fix(reshuffle filter): make sure queue config always have label type
Fix rotate config usage

INFINI Framework

Improvements

feat: allow to use default auth for agent’s auto enroll
refactor: refactor func GetFieldCaps
feat: register background job to clean up badger LSM tree
fix: skip load missing wal

期待反馈

下载地址： https://www.infinilabs.cn/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.cn

INFINI Labs 产品更新 | Easysearch 1.7.1发布，改进跨集群复制的数据加载等

Easysearch • liaosy 发表了文章 • 0 个评论 • 3484 次浏览 • 2024-03-04 15:25 • 来自相关话题

以下是本次更新的详细说明。

INFINI Easysearch v1.7.1

Easysearch 本次更新如下：

Bug fix

修复 source_reuse 与字段别名冲突
改进 HierarchyCircuitBreakerService 并添加断路器
修复 _meta 不为空且启用 source_reuse 时的映射解析错误
修复 source_reuse 下对多值还原不正确的问题

Improvements

改进 HierarchyCircuitBreakerService 并添加断路器
改进跨集群复制的数据加载，增加对 source_reuse 索引的支持

INFINI Console v1.23.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复数据迁移中数据分片范围因精度导致数据溢出显示为负数
修复删除实例队列后消费的 Offset 未重置问题
修复网友提出的各种问题，如集群设置默认打开节点、索引采集等

Improvements

优化初始化配置向导，分步骤执行
优化实例管理中增加磁盘空闲空间显示
优化实例队列名称显示

INFINI Gateway v1.23.0

Gateway 本次更新如下：

Bug fix

修复删除实例队列后消费的 Offset 未重置问题

期待反馈

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.com

如何防止 Elasticsearch 服务 OOM？

Easysearch • yangmf2040 发表了文章 • 0 个评论 • 3932 次浏览 • 2024-02-26 10:12 • 来自相关话题

那 ES 在这方面有类似参数吗？答案是没有，这也是为何 ES 会被流量打爆的原因之一。

限制最大并发访问连接数。
限制非重要索引的请求速度，保障重要业务索引的访问速度。

下面我们来详细聊聊。

架构图

所有访问 ES 的请求都发给网关，可部署多个网关。

限制最大连接数

在网关配置文件中，默认有最大并发连接数限制，默认最大 10000。

entry:
  - name: my_es_entry
    enabled: true
    router: my_router
    max_concurrency: 10000
    network:
      binding: $[[env.GW_BINDING]]
      # See `gateway.disable_reuse_port_by_default` for more information.
      reuse_port: true

使用压测程序测试，看看到达10000个连接后，能否限制新的连接。超过的连接请求，被丢弃。更多信息参考官方文档。

限制索引写入速度

env: # env 下添加
    THROTTLE_BULK_INDEXING_MAX_BYTES: 40485760 #40MB/s
    THROTTLE_BULK_INDEXING_MAX_REQUESTS: 10000 #10k docs/s
    THROTTLE_BULK_INDEXING_ACTION: retry #retry,drop
    THROTTLE_BULK_INDEXING_MAX_RETRY_TIMES: 10 #1000
    THROTTLE_BULK_INDEXING_RETRY_DELAY_IN_MS: 100 #10

router: # route 部分修改 flow
  - name: my_router
    default_flow: default_flow
    tracing_flow: logging_flow
    rules:
      - method:
          - "*"
        pattern:
          - "/_bulk"
          - "/{any_index}/_bulk"
        flow:
          - write_flow

flow: #flow 部分增加下面两段    
  - name: write_flow
    filter:
      - flow:
          flows:
            - bulking_indexing_limit
      - elasticsearch:
          elasticsearch: prod
          max_connection_per_node: 1000
  - name: bulking_indexing_limit
    filter:
      - bulk_request_throttle:
          indices:
            "test-index":
              max_bytes: $[[env.THROTTLE_BULK_INDEXING_MAX_BYTES]]
              max_requests: $[[env.THROTTLE_BULK_INDEXING_MAX_REQUESTS]]
              action: $[[env.THROTTLE_BULK_INDEXING_ACTION]]
              retry_delay_in_ms: $[[env.THROTTLE_BULK_INDEXING_RETRY_DELAY_IN_MS]]
              max_retry_times: $[[env.THROTTLE_BULK_INDEXING_MAX_RETRY_TIMES]]
              message: "bulk writing too fast" #触发限流告警message自定义
              log_warn_message: true

再次压测，test-index 索引写入速度被限制在了 1w docs/s 。

限制多个索引写入速度

  - name: bulking_indexing_limit
    filter:
      - bulk_request_throttle:
          indices:
            "abc":
              max_requests: 20000
              action: drop
              message: "abc doc写入超阈值" #触发限流告警message自定义
              log_warn_message: true
            "test-index":
              max_bytes: $[[env.THROTTLE_BULK_INDEXING_MAX_BYTES]]
              max_requests: $[[env.THROTTLE_BULK_INDEXING_MAX_REQUESTS]]
              action: $[[env.THROTTLE_BULK_INDEXING_ACTION]]
              retry_delay_in_ms: $[[env.THROTTLE_BULK_INDEXING_RETRY_DELAY_IN_MS]]
              max_retry_times: $[[env.THROTTLE_BULK_INDEXING_MAX_RETRY_TIMES]]
              message: "bulk writing too fast" #触发限流告警message自定义
              log_warn_message: true

限速效果如下

限制读请求速度

  - name: default_flow
    filter:
      - request_path_limiter:
          message: "Hey, You just reached our request limit!"                                      rules:      
            - pattern: "/(?P<index_name>abc)/_search"                          
              max_qps: 10000
              group: index_name                                    
      - elasticsearch: 
          elasticsearch: prod                            
          max_connection_per_node: 1000

再次进行测试，读取速度被限制在了 1w qps 。

限制多个索引读取速度

  - name: default_flow
    filter:
      - request_path_limiter:
          message: "Hey, You just reached our request limit!"
          rules:
            - pattern: "/(?P<index_name>abc)/_search"
              max_qps: 10000
              group: index_name
            - pattern: "/(?P<index_name>test-index)/_search"
              max_qps: 20000
              group: index_name
      - elasticsearch:
          elasticsearch: prod
          max_connection_per_node: 1000

多个网关限速

INFINI Labs 产品更新 | Console 数据迁移支持 Percentiles 均匀分区

资讯动态 • liaosy 发表了文章 • 0 个评论 • 4568 次浏览 • 2023-12-30 16:25 • 来自相关话题

INFINI Labs 产品又更新啦~，包括 Console v1.14.0，Gateway 1.21.0。其中 Console 数据迁移支持 Percentiles 均匀分区，修复已知 Bug 等。以下是本次更新的详细说明。

INFINI Console v1.14.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Features

数据迁移支持 decimal 类型分区设置
数据迁移支持 number 类型均匀分区

Bug fix

修复告警恢复后，新周期内没有发送告警通知消息的问题

INFINI Gateway v1.21.0

Gateway 本次更新如下：

Bug fix

fix log error when temp file was missing

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

feat: support even partition
feat: support nested object
fix log error when temp file was missing

期待反馈

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.com

INFINI Labs 产品更新 | 修复 Easysearch 跨集群复制索引同步问题，Gateway 内存异常增长等问题

Easysearch • liaosy 发表了文章 • 0 个评论 • 3815 次浏览 • 2023-12-01 18:45 • 来自相关话题

INFINI Easysearch v1.6.2

Easysearch 本次更新如下：

Bug fix

修复跨集群复制（CCR）不能对自动滚动生成的索引进行同步的问题

Improvements

优化初始化脚本，增加-s/-slient 参数，自动安装。
新增含 jdk/plugins 的 bundle 安装包

INFINI Gateway v1.20.0

Gateway 本次更新如下：

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

增加配置，允许设置 fasthttp client 相关参数

INFINI Console v1.12.0

Console 在线体验： http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

Bug fix

修复数据探索 multi fields 字段计算 top values 报错的问题
修复由 Framework Bug 造成连接数不释放、内存异常增长的问题
修复内网模式下静态资源远程加载的问题
修复数据看板数据源配置校验异常的问题

Improvements

优化数据探索计算 top values，使用先采样后，后取 top values
可通过配置参数 http_client.read_buffer_size 设置读取缓存大小，解决开发工具执行命令时，默认缓存太小的问题

INFINI Agent v0.7.1

Agent 本次更新如下：

Features

添加 http processor

Bug fix

修复由 Framework Bug 造成连接数不释放、内存异常增长的问题

Improvements

进一步优化内存占用，降到 50M 以下

INFINI Framework

INFINI Framework 是 INFINI Labs 各产品依赖的内部核心公共代码库。

Framework 本次更新如下：

fix: fix the issue of disk queue was blocked
chore: checkout specify branch before pull

期待反馈

下载地址： https://www.infinilabs.com/download

您还可以通过邮件联系我们：hello@infini.ltd

或者拨打我们的热线电话：(+86) 400-139-9200

欢迎加入 Discord 聊天室：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

联系我们

关于极限科技（INFINI Labs）

官网：https://www.infinilabs.com

更多...

话题描述

活动推荐

最佳回复者

: liaosy
获得 0 次赞同, 0 次感谢

: yangmf2040
获得 0 次赞同, 0 次感谢

: INFINI Labs 小助手
获得 0 次赞同, 0 次感谢

: tianqi
获得 2 次赞同, 0 次感谢

: Muses
获得 0 次赞同, 0 次感谢