文章 - 搜索客，搜索人自己的社区

Easysearch 写入限速实战

有给 ES 系统导入过数据的小伙伴都知道，给一个正在执行查询的 ES 集群导入数据，可能会影响查询的响应时间。如果导入的数据量还比较大，那请将“可能”两个字去掉。这种操作通常被限定在业务低谷期执行，如果一定要立即操作，则必须非常小心控制写入速度，避免影响到业务查询。

INFINI Easysearch 从 1.8.0 版本开始引入了写入限速功能，靠引擎自身能力对写入速度进行限制。不仅听着简单，实际用起来一点也不麻烦，我们赶紧实战一把。

测试环境

INFINI Easyssearch 1.9.0，单节点集群。

测试方法

loadgen 压测 bulk 写入，每个请求写 1000 个文档，每次测试固定写入 500w 个文档。

./loadgen-linux-amd64 -config ../config/write-yf-test.yml -d 3000 -l 5000

请求示例

{"index": {"_index": "yf-test-1shard","_id": "$[[uuid]]"}}
{"ip": "127.0.0.1", "time": "$[[now_utc_lite]]", "method": "GET","path": "/abc", "http_ver": "1.1", "status_code": "200","body_bytes": "3498","agent": "curl","agent_ver": "7.71.1"}

测试基线

单节点不限速写入测试

压测单个索引，3 主，0 副，写入速度 3.8w docs/s

压测单个索引，1 主，0 副，写入速度 2.5w docs/s

同时压测两个索引，写入速度分别是 3w docs/s 和 1.8w docs/s

节点级别限速

基于引擎层实现的限速功能，支持动态开启。比如我想将节点每秒写入的文档数，限制在 10000 个每秒，直接这样设置：

PUT _cluster/settings
{
  "transient": {
    "cluster.throttle.node.write": true
    "cluster.throttle.node.write.max_requests": 10000,
    "cluster.throttle.node.write.action": "retry"
  }
}

压测单个索引，1 主，0 副，写入速度 1w docs/s

压测单个索引，3 主，0 副，写入速度 1w docs/s

由于是限制整个节点的速度，不论索引分片如何，节点的写入上限被限制在了 10000 个文档每秒。节点上的所有分片共享节点的写入限额。

同时压测两个索引，整个节点写入速度还是 10000 个文档每秒。由于我的压测程序对两个索引的写入量是一样的，所以两个索引各占一半。实际上如果两个索引写入压力不一样，就会有高低。

节点级限速适合对节点写入极限比较清楚的条件下，想在节点层面保障集群稳定，不想细分到具体索引的场景。

索引级别限速

索引级的限速可以针对特定索引进行写入限速，避免响其他索引的读写。在之前的不限速测试中，同时写入两个索引的情况下，yf-test-3shard 能达到每秒近 3w docs/s 的写入速度，另一个索引 yf-test-1shard 能达到每秒近 1.8w docs/s 的写入速度。

接下来，我们只对 yf-test-3shard 进行限速。在索引的设置里配置相应的限流阈值：

PUT yf-test-3shard/_settings
{
    "index.throttle.write.max_requests": 2000,
    "index.throttle.write.action": "retry",
    "index.throttle.write.enable": true
}

限速设置在索引设置里查看到。

设置完限速后同时压测两个索引，yf-test-3shard 索引被限制在了 2000 docs/s 的速度，yf-test-1shard 则有更多的资源写入，达到了 2.3w docs/s 的写入速度，比之前不限速的时候稍高。

通过索引级限速功能，我们成功地限制了索引 yf-test-3shard 的写入速度，索引 yf-test-1shard 的写入并未受到影响。

分片级别限速

分片级限流功能，可限定单个分片允许最大写入速度。它不针对哪个索引，而是针对所有分片。比如我想限制每个分片每秒最多写 2000 个文档。

PUT _cluster/settings
{
  "transient": {
    "cluster.throttle.shard.write": true,
    "cluster.throttle.shard.write.max_requests": 2000,
    "cluster.throttle.shard.write.action": "retry"
  }
}

压测单个索引，1 主，0 副

1 个分片，写入速度 2000 个文档每秒。

压测单个索引，3 主，0 副

3 个分片，写入速度 6000 个文档每秒。

不论是哪个索引，全都限定一个分片 2000 的写入速度。我想这种限速比较适合一个集群中有高低配置混搭主机的场景，高配机器性能强悍，磁盘空间也大，分布的分片也多；低配主机性能和磁盘容量都有限，分布的分片数较少。你们说呢？

注意事项

节点级别限流是针对所有 DataNode。

分片级别限流只计算从协调节点分发到数据节点主分片的 bulk 请求。

节点级别和分片级别限流不冲突，可以同时启用。

限流功能不会限制系统索引流量，只针对业务索引。

继续阅读 »

有给 ES 系统导入过数据的小伙伴都知道，给一个正在执行查询的 ES 集群导入数据，可能会影响查询的响应时间。如果导入的数据量还比较大，那请将“可能”两个字去掉。这种操作通常被限定在业务低谷期执行，如果一定要立即操作，则必须非常小心控制写入速度，避免影响到业务查询。

INFINI Easysearch 从 1.8.0 版本开始引入了写入限速功能，靠引擎自身能力对写入速度进行限制。不仅听着简单，实际用起来一点也不麻烦，我们赶紧实战一把。

测试环境

INFINI Easyssearch 1.9.0，单节点集群。

测试方法

loadgen 压测 bulk 写入，每个请求写 1000 个文档，每次测试固定写入 500w 个文档。

./loadgen-linux-amd64 -config ../config/write-yf-test.yml -d 3000 -l 5000

请求示例

{"index": {"_index": "yf-test-1shard","_id": "$[[uuid]]"}}
{"ip": "127.0.0.1", "time": "$[[now_utc_lite]]", "method": "GET","path": "/abc", "http_ver": "1.1", "status_code": "200","body_bytes": "3498","agent": "curl","agent_ver": "7.71.1"}

测试基线

单节点不限速写入测试

压测单个索引，3 主，0 副，写入速度 3.8w docs/s

压测单个索引，1 主，0 副，写入速度 2.5w docs/s

同时压测两个索引，写入速度分别是 3w docs/s 和 1.8w docs/s

节点级别限速

基于引擎层实现的限速功能，支持动态开启。比如我想将节点每秒写入的文档数，限制在 10000 个每秒，直接这样设置：

PUT _cluster/settings
{
  "transient": {
    "cluster.throttle.node.write": true
    "cluster.throttle.node.write.max_requests": 10000,
    "cluster.throttle.node.write.action": "retry"
  }
}

压测单个索引，1 主，0 副，写入速度 1w docs/s

压测单个索引，3 主，0 副，写入速度 1w docs/s

由于是限制整个节点的速度，不论索引分片如何，节点的写入上限被限制在了 10000 个文档每秒。节点上的所有分片共享节点的写入限额。

同时压测两个索引，整个节点写入速度还是 10000 个文档每秒。由于我的压测程序对两个索引的写入量是一样的，所以两个索引各占一半。实际上如果两个索引写入压力不一样，就会有高低。

节点级限速适合对节点写入极限比较清楚的条件下，想在节点层面保障集群稳定，不想细分到具体索引的场景。

索引级别限速

索引级的限速可以针对特定索引进行写入限速，避免响其他索引的读写。在之前的不限速测试中，同时写入两个索引的情况下，yf-test-3shard 能达到每秒近 3w docs/s 的写入速度，另一个索引 yf-test-1shard 能达到每秒近 1.8w docs/s 的写入速度。

接下来，我们只对 yf-test-3shard 进行限速。在索引的设置里配置相应的限流阈值：

PUT yf-test-3shard/_settings
{
    "index.throttle.write.max_requests": 2000,
    "index.throttle.write.action": "retry",
    "index.throttle.write.enable": true
}

限速设置在索引设置里查看到。

设置完限速后同时压测两个索引，yf-test-3shard 索引被限制在了 2000 docs/s 的速度，yf-test-1shard 则有更多的资源写入，达到了 2.3w docs/s 的写入速度，比之前不限速的时候稍高。

通过索引级限速功能，我们成功地限制了索引 yf-test-3shard 的写入速度，索引 yf-test-1shard 的写入并未受到影响。

分片级别限速

分片级限流功能，可限定单个分片允许最大写入速度。它不针对哪个索引，而是针对所有分片。比如我想限制每个分片每秒最多写 2000 个文档。

PUT _cluster/settings
{
  "transient": {
    "cluster.throttle.shard.write": true,
    "cluster.throttle.shard.write.max_requests": 2000,
    "cluster.throttle.shard.write.action": "retry"
  }
}

压测单个索引，1 主，0 副

1 个分片，写入速度 2000 个文档每秒。

压测单个索引，3 主，0 副

3 个分片，写入速度 6000 个文档每秒。

不论是哪个索引，全都限定一个分片 2000 的写入速度。我想这种限速比较适合一个集群中有高低配置混搭主机的场景，高配机器性能强悍，磁盘空间也大，分布的分片也多；低配主机性能和磁盘容量都有限，分布的分片数较少。你们说呢？

注意事项

节点级别限流是针对所有 DataNode。

分片级别限流只计算从协调节点分发到数据节点主分片的 bulk 请求。

节点级别和分片级别限流不冲突，可以同时启用。

限流功能不会限制系统索引流量，只针对业务索引。

收起阅读 »

【搜索客社区日报】第1997期 (2025-03-06）

1.分析一下EP并行和DeepSeek开源的DeepEP代码
https://mp.weixin.qq.com/s/1Cz7oQbVkPMam3eoKQWz0w
2.DeepSearcher深度解读：Agentic RAG的出现，传统RAG的黄昏
https://mp.weixin.qq.com/s/N-oPDmkb3EKqB2IM_reO1A
3.LangGraph全新4大预构建Agents框架登场
https://mp.weixin.qq.com/s/4WU-c9hYWwvEZLvC91coVw
4.超越Cursor的AI编码利器 - Windsurf编码代理实战教程
https://www.bilibili.com/video/BV1KHPJeNEgx
5.开源大模型食用指南
https://github.com/datawhalechina/self-llm

编辑：Se7en
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1996期 (2025-03-05）

1.京东ES支持ZSTD压缩算法上线了:高性能，低成本
https://cloud.tencent.com.cn/d ... 97467

2.解读向量索引
https://cloud.tencent.com.cn/d ... 64186

3.幻方：萤火高速读写文件系统（3FS）概述
https://mp.weixin.qq.com/s/qKRioV45IbOq91XDsUEIcg

编辑：kin122
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1995期 (2025-03-04）

1. ES咋跟.NET集成啊（需要梯子）
https://medium.com/%40mehmetca ... 3477e

2. 聊聊我所知道的ES全文检索（需要梯子）
https://ngnthilakshan.medium.c ... e525b

3. 客官，K8S里来一套EFK吗？（需要梯子）
https://medium.com/devops-dev/ ... 37468

编辑：斯蒂文
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1994期 (2025-03-03）

1. ES 踩坑记：Set Processor 字段更新引发的 _source 污染
https://infinilabs.cn/blog/2025/setprocessor-bug/

2. Easysearch 新功能： IK 字段级别词典
https://infinilabs.cn/blog/202 ... arys/

3. Easysearch 磁盘水位线注意事项
https://infinilabs.cn/blog/202 ... tips/

4. Elasticsearch 中 _count 和 _stats 文档数量不一致的困惑与解决方案
https://mp.weixin.qq.com/s/8Ux7PDCoP2NMjvV6ikMxqA

5. 深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析
https://blog.csdn.net/2301_811 ... 27624

编辑：Muse
更多资讯：http://news.searchkit.cn

继续阅读 »

INFINI Labs 产品更新 | Easysearch 增加异步搜索等新特性

INFINI Labs 产品更新发布！此次更新，Easysearch 增加了新的功能和数据类型，包括 wildcard 数据类型、Point in time 搜索 API、异步搜索 API、数值和日期字段的 doc-values 搜索支持，Console 新增了日志查询功能。

INFINI Easysearch v1.11.0

INFINI Easysearch 是一个分布式的搜索型数据库，实现非结构化数据检索、全文检索、向量检索、地理位置信息查询、组合索引查询、多语种支持、聚合分析等。Easysearch 可以完美替代 Elasticsearch，同时添加和完善多项企业级功能。Easysearch 助您拥有简洁、高效、易用的搜索体验。

Easysearch 本次更新如下：

功能更新

新增 wildcard 数据类型
新增 Point in time 搜索 API
新增异步搜索 API
数值字段添加 doc-values 搜索支持
日期字段添加 doc-values 搜索支持
新增 IK 分词器自定义词典使用文档

优化改进

优化 Lucene flush 的 segment 大小，减少 I/O 开销

INFINI Console v1.29.0

INFINI Console 是一款开源的非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验：

http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

功能更新

监控（集群、节点）新增日志查询

问题修复

修复指标数据为空时的查询错误
修复初始化结束步骤中主机显示为错误的问题
修复数据探索中获取字段值建议的错误
修复告警消息热图数据显示错误的问题
修复开发工具 _sql 查询支撑 Elasticsearch 6.x 版本
修复审计日志默认排序翻页之后丢失的问题
修复 Mapping 冲突问题

优化改进

优化下发给 Agent 的配置，增加集群名称
优化柱状图和时间选择器的 UI
集群，节点，索引健康状态变更支持查看日志
增强 LDAP 身份验证的日志记录
优化监控报表里拷贝指标请求的 UI
删除索引提示增加集群信息

INFINI Gateway v1.29.0

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

问题修复

同步更新 Framework v1.1.3 修复的一些已知问题

INFINI Agent v1.29.0

INFINI Agent 负责采集和上传 Elasticsearch, Easysearch, Opensearch 集群的日志和指标信息，通过 INFINI Console 管理，支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

问题修复

同步更新 Framework v1.1.3 修复的一些已知问题

INFINI Loadgen v1.29.0

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

问题修复

同步更新 Framework v1.1.3 修复的一些已知问题

INFINI Framework v1.1.3

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

功能更新

允许注册在应用程序设置之前执行的函数（#84）
添加用于安全处理 JSON 的工具（#85）

问题修复

修复了无生产者的消费者分段问题（#89）
在代理未启用时禁用默认代理（#91）

优化改进

规范化 HTTP 错误响应结构（#86）
在 WebSocket 欢迎消息中引入系统类型（#87）

更多详情请查看以下详细的 Release Notes 或联系我们的技术支持团队！

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://infinilabs.cn

继续阅读 »

INFINI Labs 产品更新发布！此次更新，Easysearch 增加了新的功能和数据类型，包括 wildcard 数据类型、Point in time 搜索 API、异步搜索 API、数值和日期字段的 doc-values 搜索支持，Console 新增了日志查询功能。

INFINI Easysearch v1.11.0

INFINI Easysearch 是一个分布式的搜索型数据库，实现非结构化数据检索、全文检索、向量检索、地理位置信息查询、组合索引查询、多语种支持、聚合分析等。Easysearch 可以完美替代 Elasticsearch，同时添加和完善多项企业级功能。Easysearch 助您拥有简洁、高效、易用的搜索体验。

Easysearch 本次更新如下：

功能更新

新增 wildcard 数据类型
新增 Point in time 搜索 API
新增异步搜索 API
数值字段添加 doc-values 搜索支持
日期字段添加 doc-values 搜索支持
新增 IK 分词器自定义词典使用文档

优化改进

优化 Lucene flush 的 segment 大小，减少 I/O 开销

INFINI Console v1.29.0

INFINI Console 是一款开源的非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验：

http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

功能更新

监控（集群、节点）新增日志查询

问题修复

修复指标数据为空时的查询错误
修复初始化结束步骤中主机显示为错误的问题
修复数据探索中获取字段值建议的错误
修复告警消息热图数据显示错误的问题
修复开发工具 _sql 查询支撑 Elasticsearch 6.x 版本
修复审计日志默认排序翻页之后丢失的问题
修复 Mapping 冲突问题

优化改进

优化下发给 Agent 的配置，增加集群名称
优化柱状图和时间选择器的 UI
集群，节点，索引健康状态变更支持查看日志
增强 LDAP 身份验证的日志记录
优化监控报表里拷贝指标请求的 UI
删除索引提示增加集群信息

INFINI Gateway v1.29.0

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

问题修复

同步更新 Framework v1.1.3 修复的一些已知问题

INFINI Agent v1.29.0

INFINI Agent 负责采集和上传 Elasticsearch, Easysearch, Opensearch 集群的日志和指标信息，通过 INFINI Console 管理，支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

问题修复

同步更新 Framework v1.1.3 修复的一些已知问题

INFINI Loadgen v1.29.0

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

问题修复

同步更新 Framework v1.1.3 修复的一些已知问题

INFINI Framework v1.1.3

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

功能更新

允许注册在应用程序设置之前执行的函数（#84）
添加用于安全处理 JSON 的工具（#85）

问题修复

修复了无生产者的消费者分段问题（#89）
在代理未启用时禁用默认代理（#91）

优化改进

规范化 HTTP 错误响应结构（#86）
在 WebSocket 欢迎消息中引入系统类型（#87）

更多详情请查看以下详细的 Release Notes 或联系我们的技术支持团队！

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://infinilabs.cn

收起阅读 »

【搜索客社区日报】第1993期 (2025-02-27）

1.使用经过训练的 ML 模型理解稀疏向量嵌入
https://www.elastic.co/search- ... dding
2.别搞Graph RAG了，拥抱新一代RAG范式DeepSearcher
https://mp.weixin.qq.com/s/gLyaLhWWDj1WoDSxEwpT6Q
3.帮你整理好了，AI 网关的8个常见应用场景
https://mp.weixin.qq.com/s/TGOB0WRrxcOXcmg_uJCuyA
4.字节跳动开源 AIBrix：专为 vLLM 打造的可扩展、高性价比控制面
https://mp.weixin.qq.com/s/DSU3jRDCYSakW6eVp0x8mA

编辑：Se7en
更多资讯：http://news.searchkit.cn

继续阅读 »

【第7期】搜索客 Meetup | 开源智能搜索与知识库管理，极限科技 Coco AI 产品介绍

本次活动由搜索客社区、极限科技（INFINI Labs）联合举办，活动邀请到 INFINI Labs 创始人& CEO 曾勇 来分享和演示极限科技最新推出的开源搜索产品 Coco AI ，欢迎预约直播观看 ~

活动主题：开源智能搜索与知识库管理，极限科技 Coco AI 产品介绍
活动时间：2025 年 03 月 07 日 19:00-20:00（周五）
活动形式：微信视频号（极限实验室）直播
报名方式：关注或扫码海报中的二维码进行预约

嘉宾介绍

曾勇，极限科技 / INFINI Labs 创始人& CEO，前 Elastic 亚太区社区布道师，Elastic 中国区咨询业务负责人，Elasticsearch 中文社区（现搜索客）的发起人兼社区主席，目前带领团队致力于下一代实时搜索引擎与 AI 智能搜索等相关技术的研究。

主题摘要

在快速发展的人工智能时代，个人和企业对知识库管理的需求愈发迫切。有没有一个轻量级,简单,又开源免费, 高效、智能且可定制的 AI 搜索与知识库管理工具呢？

本次分享将为您详细介绍 Coco AI —— 由极限科技推出的完全开源免费的智能搜索与知识库管理工具,不仅适用于个人,也适用于企业分享知识，这次分享将为您详细介绍 Coco AI,并探讨如何利用人工智能技术和开源架构，实现智能搜索和知识管理的全面优化。

主要内容

开源智能搜索技术：

介绍开源搜索引擎与人工智能技术的结合，如何提升搜索精度和智能化水平。
展示 Coco AI 的智能搜索与 AI 助理功能，帮助个人或者企业实现精准的搜索与知识库管理。

Coco AI 产品介绍：

详细讲解 Coco AI 的开源架构，如何帮助企业或个人快速构建智能搜索引擎并进行知识管理。
强调其灵活性和定制化能力，支持跨平台和跨系统的数据整合。

智能知识库管理：

探讨 Coco AI 如何通过搜索与 AI, RAG 等技术进行自动化分类、索引与语义理解，提升知识库的管理效率。
展示 Coco AI 在实际企业中的应用，如何打破信息孤岛，实现智能化的知识共享。

开源生态与发展：

介绍 Coco AI 的开源生态，如何通过社区合作和持续创新推动技术发展。
展望开源智能搜索的未来，如何通过新兴技术推动知识管理创新。

Coco AI 已经对外正式开源和下载, 下面是相关地址, 可以先睹为快, 欢迎 Star 转发分享~

项目网站：

https://coco.rs

开源地址：

参与有奖

本次直播活动将设有福袋抽奖环节，参与就有机会获得 INFINI Labs 周边纪念品，包括 T 恤、鸭舌帽、咖啡杯、指甲刀套件、精品围巾等等（图片仅供参考，款式、颜色与尺码随机）。

活动交流

本活动设有 Meetup 技术交流群，可添加小助手微信拉群，与更多小伙伴一起学习交流。

Meetup 讲师招募

搜索客社区 Meetup 的成功举办，离不开社区小伙伴的热情参与。目前社区讲师招募计划也在持续进行中，我们诚挚邀请各位技术大咖、行业精英踊跃提交演讲议题，与大家分享您的经验。

讲师报名链接：http://cfp.searchkit.cn
或扫描下方二维码，立刻报名成为讲师！

Meetup 活动聚焦 AI 与搜索领域的最新动态，以及数据实时搜索分析、向量检索、技术实践与案例分析、日志分析、安全等领域的深度探讨。

我们热切期待您的精彩分享！

往期回顾

继续阅读 »

本次活动由搜索客社区、极限科技（INFINI Labs）联合举办，活动邀请到 INFINI Labs 创始人& CEO 曾勇 来分享和演示极限科技最新推出的开源搜索产品 Coco AI ，欢迎预约直播观看 ~

活动主题：开源智能搜索与知识库管理，极限科技 Coco AI 产品介绍
活动时间：2025 年 03 月 07 日 19:00-20:00（周五）
活动形式：微信视频号（极限实验室）直播
报名方式：关注或扫码海报中的二维码进行预约

嘉宾介绍

曾勇，极限科技 / INFINI Labs 创始人& CEO，前 Elastic 亚太区社区布道师，Elastic 中国区咨询业务负责人，Elasticsearch 中文社区（现搜索客）的发起人兼社区主席，目前带领团队致力于下一代实时搜索引擎与 AI 智能搜索等相关技术的研究。

主题摘要

在快速发展的人工智能时代，个人和企业对知识库管理的需求愈发迫切。有没有一个轻量级,简单,又开源免费, 高效、智能且可定制的 AI 搜索与知识库管理工具呢？

本次分享将为您详细介绍 Coco AI —— 由极限科技推出的完全开源免费的智能搜索与知识库管理工具,不仅适用于个人,也适用于企业分享知识，这次分享将为您详细介绍 Coco AI,并探讨如何利用人工智能技术和开源架构，实现智能搜索和知识管理的全面优化。

主要内容

开源智能搜索技术：

介绍开源搜索引擎与人工智能技术的结合，如何提升搜索精度和智能化水平。
展示 Coco AI 的智能搜索与 AI 助理功能，帮助个人或者企业实现精准的搜索与知识库管理。

Coco AI 产品介绍：

详细讲解 Coco AI 的开源架构，如何帮助企业或个人快速构建智能搜索引擎并进行知识管理。
强调其灵活性和定制化能力，支持跨平台和跨系统的数据整合。

智能知识库管理：

探讨 Coco AI 如何通过搜索与 AI, RAG 等技术进行自动化分类、索引与语义理解，提升知识库的管理效率。
展示 Coco AI 在实际企业中的应用，如何打破信息孤岛，实现智能化的知识共享。

开源生态与发展：

介绍 Coco AI 的开源生态，如何通过社区合作和持续创新推动技术发展。
展望开源智能搜索的未来，如何通过新兴技术推动知识管理创新。

Coco AI 已经对外正式开源和下载, 下面是相关地址, 可以先睹为快, 欢迎 Star 转发分享~

项目网站：

https://coco.rs

开源地址：

参与有奖

本次直播活动将设有福袋抽奖环节，参与就有机会获得 INFINI Labs 周边纪念品，包括 T 恤、鸭舌帽、咖啡杯、指甲刀套件、精品围巾等等（图片仅供参考，款式、颜色与尺码随机）。

活动交流

本活动设有 Meetup 技术交流群，可添加小助手微信拉群，与更多小伙伴一起学习交流。

Meetup 讲师招募

搜索客社区 Meetup 的成功举办，离不开社区小伙伴的热情参与。目前社区讲师招募计划也在持续进行中，我们诚挚邀请各位技术大咖、行业精英踊跃提交演讲议题，与大家分享您的经验。

讲师报名链接：http://cfp.searchkit.cn
或扫描下方二维码，立刻报名成为讲师！

Meetup 活动聚焦 AI 与搜索领域的最新动态，以及数据实时搜索分析、向量检索、技术实践与案例分析、日志分析、安全等领域的深度探讨。

我们热切期待您的精彩分享！

往期回顾

收起阅读 »

1.介绍 Kibana 中的新开发工具控制台（Dev Tools）
https://blog.csdn.net/UbuntuTo ... 31786

2.ES8 向量功能窥探系列（一）：混合搜索功能初探与增强原创
https://cloud.tencent.com.cn/d ... 33660

3.ES8 向量功能窥探系列（二）：向量数据的存储与优化
https://cloud.tencent.com.cn/d ... 98290

编辑：kin122
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1991期 (2025-02-25）

1. python日志的奇幻漂流（需要梯子）
https://medium.com/devops-dude ... 44b83

2. 本地跑大模型的工具推荐（需要梯子）
https://medium.com/%40amosgyam ... c2bbd

3. 在ES里用knn做搜索怎么搞？（需要梯子）
https://medium.com/%40imadsadd ... 82017

编辑：斯蒂文
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1990期 (2025-02-24）

1、谈谈 ES 6.8 到 7.10 的功能变迁（6）- 其他
https://infinilabs.cn/blog/202 ... rt-6/

2、使用 INFINI Gateway 保护 Elasticsearch 集群之限制请求至协调节点
https://infinilabs.cn/blog/202 ... eway/

3、用Ollama+RAGflow打造私有知识库
https://mp.weixin.qq.com/s/MHpf9PRc3Kr55iSakC3oVg

4、23张PPT搞懂DeepSeek核心技术！
https://mp.weixin.qq.com/s/c-CECCBa3JFQP-rRoMtLiw

5、Elasticsearch：在 Elastic 中玩转 DeepSeek R1 来实现 RAG 应用
https://blog.csdn.net/UbuntuTo ... 32862

编辑：Muse
更多资讯：http://news.searchkit.cnC

继续阅读 »

【搜索客社区日报】第1989期 (2025-02-20）

1.Hugging Face 最新推出的 Agent 课程
https://huggingface.co/learn/agents-course
2.smolagents 一个构建强大智能体的简洁库
https://github.com/huggingface/smolagents
3.MLSys/LLMSys课程
https://space.bilibili.com/15452596/lists
4.文末赠书 | 经典之作更新，Elasticsearch 创始人推荐的 Elasticsearch 实战宝典
https://mp.weixin.qq.com/s/aOrBgPpxGoV-BDjUM8EvpQ

编辑：Se7en
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1988期 (2025-02-19）

1.DeepSeek企业级部署实战指南：从服务器选型到Dify私有化落地
https://mp.weixin.qq.com/s/U3RYRqNppuEX4oMdgiKu9Q

2.如何在 Elasticsearch 中设置向量搜索 - 第二部分
https://blog.csdn.net/UbuntuTo ... 62747

3.Elasticsearch 混合搜索 - Hybrid Search
https://blog.csdn.net/UbuntuTo ... 97606

4. DeepSeek R1 与 OpenAI O1：怎么为自己的业务挑选合适的 AI？（搭梯）
https://medium.com/%40PedalsUp ... ca3f2

编辑：kin122
更多资讯：http://news.searchkit.cn

继续阅读 »

【搜索客社区日报】第1987期 (2025-02-18）

1. 奈飞当年是怎么搭数据管线的？（需要梯子）
https://netflixtechblog.com/ev ... 36905
2. 用ELK监控nodejs的日志怎么搞？（需要梯子）
https://medium.com/%40arnabgol ... 3915c
3. 语义搜索 + ES， 1 + 1 远远大于2（需要梯子）
https://usharengaraju.medium.c ... 97135
编辑：斯蒂文
更多资讯：http://news.searchkit.cn

继续阅读 »

INFINI Labs 产品更新 | Coco AI 开启智能知识管理新篇章

INFINI Labs 产品更新发布！此次更新，Coco AI 正式亮相，可快速实现智能化的企业或个人知识库管理；Easysearch 增强 Rollup 能力，可自定义 Rollup 索引生命周期，支持更多的聚合方式；Console 完善了 Metrics 的指标监控异常告警能力，支持指标数据变化横向对比；Agent 进行了多处优化以及修复相关 Bug，支持在 Docker 容器中开启探针进行指标采集等等。欢迎下载体验，探索更多可能！

Coco AI v0.1.0

Coco AI 是一个完全开源、跨平台的统一 AI 搜索与效率工具，能够连接并搜索多种数据源，包括应用程序、文件、谷歌网盘、Notion、语雀、Hugo 等本地与云端数据。通过接入 DeepSeek 等大模型，Coco AI 实现了智能化的企业或个人知识库管理，注重隐私，支持私有部署，帮助用户快速、智能地访问信息。

本次发布的是 Coco AI 第一个预览版本, 支持 MacOS 12 以上的操作系统, 欢迎大家下载使用 ~

项目主页: https://coco.rs/

开源地址:

桌面应用端: https://github.com/infinilabs/coco-app/
服务端: https://github.com/infinilabs/coco-server

以下是操作界面截图:

搜索本地桌面应用程序
搜索企业或个人的知识库,混合搜索多个数据源
基于个人的知识库来与 AI 助手聊天
AI 助手完整模式支持历史会话的查看
支持接入自己搭建的 Coco Server, 私有部署, 隐私安全

INFINI Easysearch v1.10.2

INFINI Easysearch 是一个分布式的搜索型数据库，实现非结构化数据检索、全文检索、向量检索、地理位置信息查询、组合索引查询、多语种支持、聚合分析等。Easysearch 可以完美替代 Elasticsearch，同时添加和完善多项企业级功能。Easysearch 助您拥有简洁、高效、易用的搜索体验。

Easysearch 本次更新如下：

功能更新

lucene 版本更新
- lucene 版本更新到 8.11.4，是 lucene8.x 系列的最后一个版本
- jna 更新到 5.12.1
IK 分词器: 增强词典配置的灵活性和可扩展性
- 支持字段级别的词典配置，用户可通过自定义 tokenizer 为不同索引、不同字段配置专用词典
- 优化词典管理机制
- 支持自定义词典与 IK 默认词典合并使用
- 词库数据存储在可配置的索引中，支持实时更新
- 可使用内置词库索引或自定义词库索引(需保持相同结构)
索引生命周期管理
- delete action 支持同时基于索引创建时间和文档最新时间戳来执行删除操作

问题修复

修复了 rollup 平均值(avg)聚合计算错误

优化改进

优化 rollup 索引的创建流程

关于 Rollup 具体如何使用，请查看这篇单独的博客：介绍 Easysearch 的 Rollup

INFINI Console v1.28.2

INFINI Console 是一款开源的非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验：

http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

功能更新

告警功能支持根据桶之间文档数差值和内容差异告警
当使用 Easysearch 存储指标时，增加 Rollup 索引生命周期

问题修复

修复 Insight API 处理多时间序列数据时数据丢失的问题

优化改进

告警图表新增复制请求
在已注册的 Agent 管理界面中新增关联凭据设置
在集群编辑中新增采集模式
当使用 Easysearch 存储指标时，自动为系统集群创建 Agent 指标写入最小权限用户
优化 LDAP 用户映射增加默认权限组

INFINI Gateway v1.28.2

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

功能更新

同步更新 Framework v1.1.2 修复的一些已知问题

优化改进

移除 Elasticsearch 过滤器中因模式不匹配导致的不必要节点重新选择（#62）

INFINI Agent v1.28.2

INFINI Agent 负责采集和上传 Elasticsearch, Easysearch, Opensearch 集群的日志和指标信息，通过 INFINI Console 管理，支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

问题修复

添加了日志并优化了一些设置 (#17)
修复了在 Docker 中使用不同用户进程时注册失败的问题 (#11)
同步更新 Framework v1.1.2 修复的一些已知问题

INFINI Loadgen v1.28.2

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

问题修复

同步更新 Framework v1.1.2 修复的一些已知问题

INFINI Framework v1.1.2

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

问题修复

修复了队列消费者崩溃时 []byte 操作符的问题 (#77)
修复了索引统计信息收集任务中间隔配置不正确的问题 (#80)
修复了重载文件需要使用先前位置的问题 (#79)
通过将集群健康默认状态初始化为绿色来修复空指针崩溃 (#81)

优化改进

重构环回地址以使用常量 (#73)
为队列消费者添加调试消息 (#77)

更多详情请查看以下详细的 Release Notes 或联系我们的技术支持团队！

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://infinilabs.cn

继续阅读 »

INFINI Labs 产品更新发布！此次更新，Coco AI 正式亮相，可快速实现智能化的企业或个人知识库管理；Easysearch 增强 Rollup 能力，可自定义 Rollup 索引生命周期，支持更多的聚合方式；Console 完善了 Metrics 的指标监控异常告警能力，支持指标数据变化横向对比；Agent 进行了多处优化以及修复相关 Bug，支持在 Docker 容器中开启探针进行指标采集等等。欢迎下载体验，探索更多可能！

Coco AI v0.1.0

Coco AI 是一个完全开源、跨平台的统一 AI 搜索与效率工具，能够连接并搜索多种数据源，包括应用程序、文件、谷歌网盘、Notion、语雀、Hugo 等本地与云端数据。通过接入 DeepSeek 等大模型，Coco AI 实现了智能化的企业或个人知识库管理，注重隐私，支持私有部署，帮助用户快速、智能地访问信息。

本次发布的是 Coco AI 第一个预览版本, 支持 MacOS 12 以上的操作系统, 欢迎大家下载使用 ~

项目主页: https://coco.rs/

开源地址:

桌面应用端: https://github.com/infinilabs/coco-app/
服务端: https://github.com/infinilabs/coco-server

以下是操作界面截图:

搜索本地桌面应用程序
搜索企业或个人的知识库,混合搜索多个数据源
基于个人的知识库来与 AI 助手聊天
AI 助手完整模式支持历史会话的查看
支持接入自己搭建的 Coco Server, 私有部署, 隐私安全

INFINI Easysearch v1.10.2

INFINI Easysearch 是一个分布式的搜索型数据库，实现非结构化数据检索、全文检索、向量检索、地理位置信息查询、组合索引查询、多语种支持、聚合分析等。Easysearch 可以完美替代 Elasticsearch，同时添加和完善多项企业级功能。Easysearch 助您拥有简洁、高效、易用的搜索体验。

Easysearch 本次更新如下：

功能更新

lucene 版本更新
- lucene 版本更新到 8.11.4，是 lucene8.x 系列的最后一个版本
- jna 更新到 5.12.1
IK 分词器: 增强词典配置的灵活性和可扩展性
- 支持字段级别的词典配置，用户可通过自定义 tokenizer 为不同索引、不同字段配置专用词典
- 优化词典管理机制
- 支持自定义词典与 IK 默认词典合并使用
- 词库数据存储在可配置的索引中，支持实时更新
- 可使用内置词库索引或自定义词库索引(需保持相同结构)
索引生命周期管理
- delete action 支持同时基于索引创建时间和文档最新时间戳来执行删除操作

问题修复

修复了 rollup 平均值(avg)聚合计算错误

优化改进

优化 rollup 索引的创建流程

关于 Rollup 具体如何使用，请查看这篇单独的博客：介绍 Easysearch 的 Rollup

INFINI Console v1.28.2

INFINI Console 是一款开源的非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管，企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验：

http://demo.infini.cloud (用户名/密码：readonly/readonly)。

Console 本次更新如下：

功能更新

告警功能支持根据桶之间文档数差值和内容差异告警
当使用 Easysearch 存储指标时，增加 Rollup 索引生命周期

问题修复

修复 Insight API 处理多时间序列数据时数据丢失的问题

优化改进

告警图表新增复制请求
在已注册的 Agent 管理界面中新增关联凭据设置
在集群编辑中新增采集模式
当使用 Easysearch 存储指标时，自动为系统集群创建 Agent 指标写入最小权限用户
优化 LDAP 用户映射增加默认权限组

INFINI Gateway v1.28.2

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关，所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下：

功能更新

同步更新 Framework v1.1.2 修复的一些已知问题

优化改进

移除 Elasticsearch 过滤器中因模式不匹配导致的不必要节点重新选择（#62）

INFINI Agent v1.28.2

INFINI Agent 负责采集和上传 Elasticsearch, Easysearch, Opensearch 集群的日志和指标信息，通过 INFINI Console 管理，支持主流操作系统和平台，安装包轻量且无任何外部依赖，可以快速方便地安装。

Agent 本次更新如下：

问题修复

添加了日志并优化了一些设置 (#17)
修复了在 Docker 中使用不同用户进程时注册失败的问题 (#11)
同步更新 Framework v1.1.2 修复的一些已知问题

INFINI Loadgen v1.28.2

INFINI Loadgen 是一款开源的专为 Easysearch、Elasticsearch、OpenSearch 设计的轻量级性能测试工具。

Loadgen 本次更新如下：

问题修复

同步更新 Framework v1.1.2 修复的一些已知问题

INFINI Framework v1.1.2

INFINI Framework 是 INFINI Labs 基于 Golang 的产品的核心基础，已开源。该框架以开发者为中心设计，简化了构建高性能、可扩展且可靠的应用程序的过程。

Framework 本次更新如下：

问题修复

修复了队列消费者崩溃时 []byte 操作符的问题 (#77)
修复了索引统计信息收集任务中间隔配置不正确的问题 (#80)
修复了重载文件需要使用先前位置的问题 (#79)
通过将集群健康默认状态初始化为绿色来修复空指针崩溃 (#81)

优化改进

重构环回地址以使用常量 (#73)
为队列消费者添加调试消息 (#77)

更多详情请查看以下详细的 Release Notes 或联系我们的技术支持团队！

期待反馈

欢迎下载体验使用，如果您在使用过程中遇到如何疑问或者问题，欢迎前往 INFINI Labs Github（https://github.com/infinilabs）中的对应项目中提交 Feature Request 或提交 Bug。

下载地址： https://infinilabs.cn/download

邮件：hello@infini.ltd

电话：(+86) 400-139-9200

Discord：https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手（INFINI-Labs），加入用户群一起讨论交流。

关于极限科技（INFINI Labs）

极限科技，全称极限数据（北京）科技有限公司，是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室（INFINI Labs）致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队，采用天然分布式的方式来进行远程协作，员工分布在全球各地，希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选，为中国技术品牌输出添砖加瓦。

官网：https://infinilabs.cn

收起阅读 »