【搜索客社区日报】第2075期 (2025-07-15)
社区日报 • God_lockin 发表了文章 • 0 个评论 • 1568 次浏览 • 6 天前
https://medium.com/%40imadsadd ... 90485
2. 10亿记录一秒返回,干就完了(需要梯子)
https://medium.com/%40ApacheDo ... e3a12
3. 我在Trendyol我们是这样用ES做聚合的(需要梯子)
https://medium.com/trendyol-te ... 1c4b2
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2076期 (2025-07-16)
社区日报 • kin122 发表了文章 • 0 个评论 • 1340 次浏览 • 5 天前
https://mp.weixin.qq.com/s/fC3iNOSWlSnofRM804RYOQ
2.森马服饰从 Elasticsearch 到阿里云 SelectDB 的架构演进之路
https://zhuanlan.zhihu.com/p/1927036355139045220
3.RAG 的最佳 PDF 提取器是什么?(搭梯)
https://levelup.gitconnected.c ... b06e0
编辑:kin122
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2077期 (2025-07-17)
社区日报 • Se7en 发表了文章 • 0 个评论 • 969 次浏览 • 4 天前
https://mp.weixin.qq.com/s/9l1Uupthv9zBqvo5v_N94g
2.AWS Kiro 最懂程序员的IDE - SPEC模式初体验,稳得出人意料!
https://www.bilibili.com/video/BV18vgwzYEri/
3.Chunked-Prefills 分块预填充机制详解
https://mp.weixin.qq.com/s/JIvbYapMMtC8JkBEXHsG-A
编辑:Se7en
更多资讯:http://news.searchkit.cn
极限科技亮相 TDBC 2025 可信数据库发展大会,连续三年荣誉入选信通院《中国数据库产业图谱》
资讯动态 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 615 次浏览 • 3 天前
2025 年 7 月 16 日,由中国通信标准化协会主办、中国信息通信研究院(以下简称“中国信通院”)承办的“TDBC 2025 可信数据库发展大会”在北京隆重召开。作为我国数据库领域的年度权威盛会,本次大会以“自主·创新·引领”为主题,聚焦数据库技术创新与产业实践,发布了多项前沿研究成果,并深入探讨了行业发展趋势。极限科技受邀参会,并凭借在搜索型数据库领域的突出表现,连续三年荣誉入选《中国数据库产业图谱(2025 年)》,再次彰显其技术实力与市场影响力。

权威盛会聚焦技术前沿,共绘产业新蓝图
TDBC 2025 可信数据库发展大会是我国数据库行业规格最高、影响力最广的年度盛会之一。本届大会汇聚了政府主管部门、行业领袖、科研机构及企业代表,围绕数据库核心技术突破、行业应用落地、生态协同发展等议题展开深度交流。中国信通院在会上发布了一系列重磅研究成果,其中《中国数据库产业图谱》作为全面展示国内数据库产业生态的权威报告,备受业界关注。
极限科技连续三年入选产业图谱,搜索型数据库代表获权威认可
《中国数据库产业图谱(2025 年)》由中国信通院基于产品技术能力、产业服务水平、市场表现及生态建设等多维度综合评估编制,旨在为行业用户提供选型参考,推动资源向优质企业集聚。极限科技作为搜索型数据库的代表企业之一,凭借其自主研发的分布式搜索分析引擎、高性能实时数据处理能力,以及在金融、政务、能源等关键行业的深度实践,连续三年荣誉入选图谱,并收录于搜索型数据库及数据库生态社区技术社区版块,成为数据库产业生态中的标杆企业。

图:极限科技荣誉入选中国信通院《中国数据库产业图谱(2025 年)》
极限科技相关负责人表示:“连续三年入选产业图谱,既是行业对极限科技技术实力的肯定,也是我们持续深耕搜索型数据库领域的动力。未来,我们将继续坚持自主创新,深化技术突破,为行业客户提供更高效、更智能的数据检索与分析解决方案。”
以自主创新为引擎,引领搜索型数据库高质量发展
当前,随着企业数字化转型的加速,海量数据的实时检索与智能分析已成为刚需。极限科技聚焦搜索型数据库核心技术,通过分布式架构、AI 融合、云原生等技术创新,打造了覆盖数据全生命周期的产品矩阵。其核心产品支持 PB 级数据秒级响应,并具备高可用、弹性扩展等特性,已在多个国家级项目中落地应用,助力客户实现数据治理能力与业务效能的双重提升。

此次大会上,极限科技还与业界同仁共同探讨了搜索型数据库如何支撑数字经济高质量发展。与会专家指出,随着数据要素价值的加速释放,搜索型数据库作为挖掘数据价值的关键工具,其自主创新水平直接关系到国家数据安全与产业竞争力。极限科技的实践为行业提供了可复制的范本,彰显了中国数据库企业的责任与担当。
展望未来:携手生态伙伴,共筑可信数据底座
极限科技表示,未来将持续深化与中国信通院等权威机构的合作,积极参与标准制定与生态共建,推动搜索型数据库技术与产业需求的深度融合。同时,公司将加大研发投入,探索数据库与人工智能等新技术的协同创新,为构建安全、高效、智能的数据基础设施贡献力量。
TDBC 2025 可信数据库发展大会的圆满落幕,标志着我国数据库产业迈向更高水平的自主创新阶段。极限科技将以此次入选产业图谱为契机,携手行业伙伴,共同书写中国数据库产业的新篇章。
【搜索客社区日报】第2078期 (2025-07-18)
社区日报 • Fred2000 发表了文章 • 0 个评论 • 860 次浏览 • 3 天前
https://my.oschina.net/u/7209245/blog/18684967
2、Coco AI 快速构建本地文档知识库增强检索+智能问答系统
https://mp.weixin.qq.com/s/fcchZQm_FLuW_jhrZVwJlQ
3、一文了解 - Elasticsearch 搜索的底层原理-解析
https://mp.weixin.qq.com/s/06e_iIN43BgKVYJNAnmoLA
4、本地 RAG 实战:用 Easysearch + Ollama SDK 半小时搭建检索增强问答系统
https://mp.weixin.qq.com/s/G4Wk_A7G7QiZIQpjCYJ1kw
5、会 Vibe Coding(氛围编程) 的同事:我一个人干掉整个技术部!
https://mp.weixin.qq.com/s/1nV-3YCPBJcnpNasb_fN3A
编辑:Fred
更多资讯:http://news.searchkit.cn
极限科技亮相 TDBC 2025 可信数据库发展大会——联合创始人曾嘉毅分享搜索型数据库生态建设新成果
资讯动态 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 610 次浏览 • 3 天前
2025 年 7 月 17 日 在北京召开的 TDBC 2025 可信数据库发展大会·数据库生态及国际化分论坛 上,全球数据库领域专家、学者与企业代表齐聚。极限数据(北京)科技有限公司联合创始人曾嘉毅发表《搜索型数据库生态建设及展望》主题演讲,剖析技术创新与实践,为行业提供高效数据检索与智能应用方案。

破解数据检索挑战,AI 赋能搜索升级
首先,我们需要面对结构化数据。典型处理方式是使用传统关系型数据库。但是,关系型数据库的设计初衷就决定了它面对的挑战:关系型数据库优先保证事务性,其数据分层结构导致查询需要层层下钻,同时传统关系型数据库能够处理的数据规模也是受限的。搜索型数据库针对以上挑战可以实现读写分离、多表聚合查询、数据库加速等。
与此同时,企业数据中大约 85% 为非结构化或半结构化数据,如图片、视频等,传统数据库处理困难。极限科技运用语义解析与 AI 向量化技术,语义解析深入理解数据语义并转化为结构化信息,AI 向量化将其映射到高维空间实现向量化表示,二者结合完成非结构化数据的标签提取与索引构建,提升检索准确性与效率。

针对中文文本,极限科技进行字段化处理研究。中文语法复杂、语义丰富,传统方法难以满足检索需求。公司通过自研算法精准分词与字段提取,结合向量化技术提升中文数据检索效果。同时,融合向量化全量搜索与模糊搜索,前者快速定位相似数据,后者处理用户输入的不准确信息,提高搜索容错性。
平台化建设与工具开源:打造全链路能力
极限科技构建的管控平台功能强大。支持多集群元原生编排和管理,企业可依业务场景和用户需求灵活调整集群资源,同时实现一键升级、备份管理等;提供统一监控、统一身份管理服务,实时监控系统组件与运行状态,及时预警问题。该平台兼容多厂商环境,企业可无缝集成现有系统,降低迁移成本与风险。公司开发的搜索服务网关针对检索服务提供流量分发与链路加速能力,进而实现查询分析、干预等高阶功能。

此外,极限科技积极推动搜索周边工具开源贡献。数据迁移工具 [ESM](https://github.com/medcl/esm) 助力企业快速安全迁移数据至自家搜索型数据库,缩短迁移周期、降低风险;性能压测工具 [Loadgen](https://github.com/infinilabs/loadgen) 模拟复杂场景测试系统性能,评估性能瓶颈与承载能力;中文分词工具 [IK](https://github.com/infinilabs/analysis-ik)/[Pinyin](https://github.com/infinilabs/analysis-pinyin) 支持多种分词模式与自定义词典,满足不同用户需求。开源工具促进技术交流创新,支持行业生态发展。
“Coco” AI 搜索与智能体结合模式:重构搜索体验
[Coco AI](https://coco.rs/) 采用获得国家专利设计的人机交互体验,将搜索与 AI 进行无缝结合。传统 RAG 存在大模型直接回答搜索问题存在训练成本高、回答不精准问题。 Coco AI 后台灵活,支持为不同类型问题分配专属“小助手”。“小助手”针对特定问题优化配置,精准理解用户意图、提供准确回答,降低训练成本、提升回答精准度与效率。可以快速量身打造企业专属的 AI 智能体工具箱。

Coco AI 结合本地与云端协同搜索技术,连接本地文件、数据库及外部应用系统数据源。用户搜索时,可以同时对本地和外部 Coco Server 引擎同时处理查询请求,然后对结果进行打分与整合去重排序,结合大模型总结分析最终结果,实现意图理解与统一信息获取,打破信息孤岛,提供全面准确高效的搜索服务。
展望未来:AI 搜索与开放生态
极限科技对搜索型数据库未来有清晰规划。下一代 AI 搜索架构将深度融合向量检索与智能体技术。向量检索已发挥重要作用,智能体技术能自主感知、决策与行动。二者融合使 AI 搜索系统更智能理解用户需求,主动提供个性化服务,如依历史记录推荐信息,面对复杂任务自主分解协调资源处理。
在企业数据应用场景上,下一代架构将进一步优化拓展。除传统文档检索、数据查询,还将深入生产、运营、管理等环节,提供全面深入的数据分析与决策支持。如在生产制造中实时分析设备数据、提前发现故障隐患;在市场营销中深度挖掘客户数据、制定精准营销策略。

为推动行业发展,极限科技将持续推进开源战略,通过 [GitHub](https://github.com/infinilabs/)/[Gitee](https://gitee.com/infinilabs/)/[GitCode](https://gitcode.com/infinilabs/) 等平台共享核心技术代码与文档,与全球开发者紧密合作。吸引更多开发者参与研发创新,共同解决技术难题。同时积极参与行业标准制定推广,促进市场规范化标准化发展,构建开放共享共赢的搜索型数据库生态。
此次分享展示了极限科技的技术实力与创新成果,为行业发展提供新思路方向。相信未来,极限科技将秉持创新、开放、合作理念,推动技术发展应用,为企业数字化转型与行业发展注入新动力。
TDBC 2025 大会聚焦 AI 与数据库融合,极限科技发布新一代 Coco AI 搜索平台
资讯动态 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 612 次浏览 • 3 天前
2025 年 7 月 17 日 在北京召开的 TDBC 2025 可信数据库发展大会·人工智能与数据库融合发展分论坛 上,国内领先的搜索数据库及解决方案提供商 极限科技(INFINI Labs)正式发布其创新产品 —— Coco AI,一款面向企业的 AI 智能搜索与高效协作平台。极限数据(北京)科技有限公司创始人曾勇在《下一代企业搜索与 AI 的融合探索》主题演讲中,深入探讨了企业搜索的未来趋势及 Coco AI 的核心价值。

破解企业数据困境:多平台孤岛与隐私安全挑战
随着企业数据呈爆发式增长,信息分散在本地文件系统、云存储(如 S3)、协作工具(如内网 Wiki、工单系统、 CRM、ERP 等)及代码仓库(如 Gitcode、Gitee 等)等多个平台,员工往往需要频繁切换系统进行检索,效率低下。同时,企业对数据隐私和安全的高标准要求,使得直接使用公有云 AI 工具或上云存储存在潜在风险。此外,企业内部积累的海量知识未能有效转化为生产力,传统知识库管理依赖人工维护,效果有限。

Coco AI 的推出,正是为了帮助企业解决这些痛点,通过统一搜索、AI 增强、隐私优先的设计理念,打造一站式智能搜索中心,提升知识利用效率与协作体验。
Coco AI 核心功能:重新定义企业搜索与协作

- 跨平台统一搜索
- 支持本地文件、云端应用或自研各业务系统及第三方平台的无缝搜索,提供“本地搜”“云端搜”“混合搜”及“多模态搜”(文本、语音、图像、视频)能力,彻底告别数据碎片化。
- 支持本地文件、云端应用或自研各业务系统及第三方平台的无缝搜索,提供“本地搜”“云端搜”“混合搜”及“多模态搜”(文本、语音、图像、视频)能力,彻底告别数据碎片化。
- 无缝 AI 集成
- 基于语义搜索与生成式 AI 技术,支持快速提取企业内部知识,并接入 OpenAI、DeepSeek 等主流大模型。
- 相比集中式知识库,采用联邦数据连接方式,降低维护成本。
- 提供高度可定制的 RAG(检索增强生成)管道,让 AI 回答更精准、更贴合业务需求。
- 基于语义搜索与生成式 AI 技术,支持快速提取企业内部知识,并接入 OpenAI、DeepSeek 等主流大模型。
- 隐私优先设计
- 支持自托管部署,数据全程加密,提供企业级权限控制与动态脱敏功能,确保敏感信息不外泄,满足金融、医疗等高合规性行业需求。
- 支持自托管部署,数据全程加密,提供企业级权限控制与动态脱敏功能,确保敏感信息不外泄,满足金融、医疗等高合规性行业需求。
- 灵活扩展性
- 通过 MCP 协议、Connector 及 Remote Search Adapter(RSA)对接企业自有数据源,支持 API 和插件扩展,适配多样化业务场景。
轻量级体验,高效团队协作
Coco AI 以“轻量级、无存在感”为设计理念,内置实用工具(如计算器、便签)及团队协作功能,支持快速定位共享资源。其智能助手可在搜索中实时总结结果,提升决策效率。此外,APP 端支持多服务器连接,实现跨域协作而无需集中同步数据,兼顾便利性与安全性。
技术架构与生态兼容
Coco AI Server 基于极限科技的搜索型数据库的 [Easysearch](https://infinilabs.cn/products/easysearch/) 即可运行,支持从单机到 PB 级分布式扩展,并针对中文语义进行了深度优化。其开放生态兼容 MCP 协议、主流大模型及第三方工具,企业可灵活集成现有系统,降低迁移成本。

开源共建,赋能开发者生态
极限科技始终秉持开放合作理念,Coco AI 已正式开源,并邀请全球开发者共同参与生态建设。用户可通过 [GitHub](https://github.com/infinilabs/)/[Gitee](https://gitee.com/infinilabs/)/[GitCode](https://gitcode.com/infinilabs/) 来获取代码、提交贡献,或加入官方社群获取技术支持。

曾勇表示:“Coco AI 的诞生,不仅是极限科技在搜索与 AI 融合领域的一次重大突破,更是我们对‘让搜索更简单’这一使命的践行。未来,我们将持续优化产品,助力企业释放数据价值,迈向智能化搜索新未来。”
- 通过 MCP 协议、Connector 及 Remote Search Adapter(RSA)对接企业自有数据源,支持 API 和插件扩展,适配多样化业务场景。
【搜索客社区日报】第2079期 (2025-07-21)
社区日报 • Muses 发表了文章 • 0 个评论 • 122 次浏览 • 10 小时前
https://elasticstack.blog.csdn ... 59222
2、AI 驱动的仪表板:从愿景到 Kibana
https://elasticstack.blog.csdn ... .5502
3、ES|QL(Elasticsearch 查询语言)入门
https://elasticstack.blog.csdn ... 99991
4、Elasticsearch 集群慢写入调优
https://mp.weixin.qq.com/s/wSe3lwGOxERQoM-qfDlmpw
5、逐层推理:单张24G显卡推理Qwen3-14B
https://mp.weixin.qq.com/s/dHLg_aX7hvuna-QI6Rhh-w
编辑:Muse
更多资讯:http://news.searchkit.cn