沙师弟,师父的充电器掉了

【搜索客社区日报】第2114期 (2025-09-12)

社区日报Fred2000 发表了文章 • 0 个评论 • 411 次浏览 • 1 天前 • 来自相关话题

1、搜索百科(1):Lucene —— 打开现代搜索世界的第一扇门
https://elasticsearch.cn/article/15557

2、AI写代码,第一稿95%都没用?一名工程师的Claude Code六周实录
https://blog.csdn.net/csdnnews ... 33438

3、如何使用极限网关实现 Easysearch 数据迁移?
https://blog.csdn.net/yangmf20 ... 55265

4、你有没有想过不额外安装 Kibana,就能实现集群核心指标数据的可视化?
https://mp.weixin.qq.com/s/YQIJG8auOxslINg90MBafA

5、在 Coco AI 中接入 WordPress RSS,实现文章秒级搜索
https://blog.csdn.net/weixin_3 ... 03720

编辑:Fred
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2113期 (2025-09-11)

社区日报Se7en 发表了文章 • 0 个评论 • 678 次浏览 • 1 天前 • 来自相关话题

1.MCP 社区推出 MCP Registry
https://blog.modelcontextproto ... view/
2.大模型推理革命:从 GPT-5 到 vLLM Semantic Router
https://mp.weixin.qq.com/s/F6pGYNhLVxyW4It9-QtklQ
3.OpenAI Codex 零基础入门指南
https://mp.weixin.qq.com/s/HHceGuE46llL-ZS9T0hiXA
4.使用 NVIDIA Dynamo 部署 PD 分离推理服务
https://mp.weixin.qq.com/s/6_oRs7p6wwL1HqnKr8yC5Q

编辑:Se7en
更多资讯:http://news.searchkit.cn

kibana和es的跨集群搜索是否可以连接easysearch?

Easysearchmedcl 回复了问题 • 2 人关注 • 1 个回复 • 720 次浏览 • 1 天前 • 来自相关话题

搜索百科(1):Lucene —— 打开现代搜索世界的第一扇门

Luceneliaosy 发表了文章 • 0 个评论 • 1145 次浏览 • 3 天前 • 来自相关话题

大家好,我是 INFINI Labs 的石阳。

这是《搜索百科》系列文章,每天 5 分钟,带你速览一款搜索相关的技术或产品,同时还会带你探索它们背后的技术原理、发展故事及上手体验等。

搜索技术看似专业,但它早已深度融入我们的日常生活。无论是电商搜索、知识检索,还是 AI 语义搜索、RAG、向量检索,背后都有经典与新兴技术的结合。希望这个系列能帮大家建立更清晰的认知,也欢迎留言交流。

引言:为什么先写 Lucene?


![](https://infinilabs.cn/img/blog ... /1.jpg)

如果你曾用 GitHub 搜代码、用电商网站搜商品,或者在日志平台里“捞”报错,你就已经享受了 Lucene 的红利——只是自己还不知道。今天,让我们认识下这位“幕后大佬”,看看它如何以一己之力,孵化了整个现代搜索江湖。没有它,就没有 Elasticsearch 的锋芒,也没有 Solr 的稳健。讲搜索,不从 Lucene 开始,就像讲武侠不提《易筋经》——根基都丢了。

诞生故事:一个程序员的“副业”成果


Lucene 的诞生颇具传奇色彩。它的创造者 Doug Cutting(后来也是 Hadoop 的创始人之一)在 1997 年开始开发 Lucene,最初是为了给他的个人项目——一个网络爬虫和搜索引擎——提供搜索能力。

![](https://infinilabs.cn/img/blog ... /2.jpg)

当时,市面上并没有成熟的开源搜索库可用,Doug 决定自己写一个。他在业余时间一点点打磨,最终在 1999 年发布了第一个版本。2001 年,Lucene 加入了 Apache 软件基金会,成为 Apache 的第一个开源搜索项目。

有趣的是,Lucene 的名字并不是来自什么技术术语,而是取自 Doug Cutting 妻子的中间名——Lucene。这也让这个项目多了一丝浪漫的色彩。

Lucene 概述


Apache Lucene,是一个用 Java 编写的高性能、全文搜索引擎库。它不是那种你下载下来就能直接用的“搜索软件”,而是一个底层库,就像乐高积木里的基础砖块,虽然不起眼,但没有它,很多搜索产品根本搭不起来。

Lucene 提供了强大的索引和查询能力,支持分词、倒排索引、相关性评分、模糊查询、布尔查询等一系列功能。它是 Elasticsearch、Solr、Easysearch、OpenSearch 等现代搜索引擎的核心引擎。

  • 首次发布:1999 年
  • 最新版本:截至 2025 年 9 月,Lucene 已更新至 10.2.x 系列
  • 开源协议:Apache License 2.0(商业友好)
  • 官网:[https://lucene.apache.org/](https://lucene.apache.org/)
  • GitHub:[https://github.com/apache/lucene](https://github.com/apache/lucene)

    社区生态


    虽然已经 25 岁"高龄",Lucene 的社区却依然活力满满。作为 Apache 软件基金会的顶级项目,它拥有:

  • 100+ 活跃贡献者
  • 每月都有新的 commit 和 issue 处理
  • 每年发布 2-4 个主要版本
  • 完善的文档和活跃的邮件列表

    虽然不像 Elasticsearch 那样“出圈”,但在开发者和企业内部系统中仍有广泛使用。

    功能亮点:为什么大家都爱它?


  • 高性能全文检索内核:倒排索引、短语/布尔/通配符/模糊查询、相关性打分。
  • 面向工程的可扩展分析链:分词器、过滤器、同义词、停用词、高亮、排序等。
  • 近邻向量检索(KNN):原生支持高维向量的最近邻搜索,为语义检索/RAG 奠基。 
  • 嵌入式 & 纯 Java:作为库嵌入任意 Java 应用,掌控细粒度行为与性能。
  • 成熟稳定的版本线:9.x 与 10.x 并行演进,兼顾稳定与新特性。

    对比优势:Lucene vs 世界


    | 产品 | 类型 | 与 Lucene 的关系 |
    | ------------- | ---------- | ---------------------------------------- |
    | Elasticsearch | 分布式引擎 | 基于 Lucene,提供分布式、RESTful 接口 |
    | Apache Solr | 搜索平台 | 基于 Lucene,提供 Web 管理界面和更多功能 |
    | Meilisearch | 轻量引擎 | 不基于 Lucene,用 Rust 编写,主打易用性 |

    Lucene 是底层引擎,而其他产品是在它之上构建的完整解决方案。如果你想要完全控制搜索逻辑,Lucene 是最佳选择;如果你想要开箱即用的搜索服务,可以考虑 Elasticsearch 或 Solr。

    快速上手:10 分钟体验 Lucene


    虽然 Lucene 需要写一些 Java 代码,但其实入门并不复杂。

    1. 环境准备


    ```java
    // Maven 依赖


    org.apache.lucene
    lucene-core
    10.xx.xx

    ```

    ### 2. 创建你的第一个索引

    ```java
    // 创建分析器(支持中文)
    Analyzer analyzer = new StandardAnalyzer();

    // 创建索引
    Directory directory = FSDirectory.open(Paths.get("index"));
    IndexWriterConfig config = new IndexWriterConfig(analyzer);
    IndexWriter writer = new IndexWriter(directory, config);

    Document doc = new Document();
    doc.add(new TextField("content", "欢迎来到 Lucene 的世界", Field.Store.YES));
    writer.addDocument(doc);
    writer.close();
    ```

    ### 3. 执行搜索

    ```java
    // 搜索 "Lucene"
    Query query = new TermQuery(new Term("content", "lucene"));
    IndexReader reader = DirectoryReader.open(directory);
    IndexSearcher searcher = new IndexSearcher(reader);
    TopDocs results = searcher.search(query, 10);

    System.out.println("找到 " + results.totalHits + " 条结果");
    ```

    几行 Java 代码,就能完成一个迷你搜索引擎。

    ## 结语

    Apache Lucene 虽然不是面向最终用户的产品,但它是**搜索技术的基石**。几乎所有现代搜索引擎都离不开它。如果你对搜索技术有兴趣,学习 Lucene 是理解搜索引擎工作原理的最佳途径。

    ---

    🚀 **下期预告**
    下一篇,我将介绍 Lucene 的第一个"孩子"—— **Apache Solr**,看看这个基于 Lucene 的企业级搜索平台如何让搜索变得更简单。

    💬 **三连互动**

    1. 你或公司最近在用 Lucene 吗?拿来做了什么场景?
    2. 你觉得 Lucene 最香 / 最坑的点是什么?
    3. 下一期想先看 **Solr** 还是 **Elasticsearch** ?留言告诉我,我来插队!

    对搜索技术感兴趣的朋友,也欢迎加我微信(ID:lsy965145175)备注“搜索百科”,拉你进  **搜索技术交流群**,一起探讨与学习!

    > 原文:https://infinilabs.cn/blog/202 ... cene/

【搜索客社区日报】第2112期 (2025-09-10)

社区日报kin122 发表了文章 • 0 个评论 • 1064 次浏览 • 3 天前 • 来自相关话题

1.Elasticsearch 与 PostgreSQL 在 RAG 系统中的比较(搭梯)
https://blog.gopenai.com/elast ... e0ddb

2.使用 Elasticsearch 增强 RAG:深入了解高级搜索功能(搭梯)
https://medium.com/%40hiconcep ... 99d86

3.将网站转变为LLM的知识库(搭梯)
https://medium.com/data-scienc ... 7c1d3


编辑:kin122    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2111期 (2025-09-09)

社区日报God_lockin 发表了文章 • 0 个评论 • 1612 次浏览 • 4 天前 • 来自相关话题

1. 可以用ES做RAG的上下文工程吗(需要梯子)
https://carlylrichmond.medium. ... 8b19f
2. 把opensearch换成minisearch得不得行?(需要梯子)
https://medium.com/collaborne- ... f7395
3. 能hold住数据持续增长的ES吗?(需要梯子)
https://medium.com/%40tumersev ... 49ac7
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 

【搜索客社区日报】第2110期 (2025-09-08)

社区日报Muses 发表了文章 • 0 个评论 • 1749 次浏览 • 5 天前 • 来自相关话题

1、Elastic Observability 中 Discover 的跟踪,用于深入的应用洞察
https://elasticstack.blog.csdn ... 14513

2、使用 cloud-native Elasticsearch 与 ECK 运行
https://elasticstack.blog.csdn ... 09367

3、什么是上下文工程 (Context Engineering)?
https://elasticstack.blog.csdn ... 32162

4、转变数据交互:在 Amazon Bedrock AgentCore Runtime 上部署 Elastic 的 MCP 服务器以构建 agentic AI 应用程序
https://elasticstack.blog.csdn ... 24592

5、初探:从0开始的AI-Agent开发踩坑实录
https://mp.weixin.qq.com/s/7Lt3WKmHoQY5HifnPFjxoQ

编辑:Muse
更多资讯:http://news.searchkit.cn
 

【搜索客社区日报】第2109期 (2025-09-05)

社区日报Fred2000 发表了文章 • 0 个评论 • 2803 次浏览 • 2025-09-05 14:00 • 来自相关话题

1、新一代搜索引擎,据说是 ES 的 15 倍?
https://mp.weixin.qq.com/s/gMSu2yzX7BT56EvTlxiCgA

2、得物灵犀搜索推荐词分发平台演进 3.0
https://my.oschina.net/u/5783135/blog/18690593

3、检索升级实践:亲手打造 “更聪明” 的文档理解系统!
https://my.oschina.net/u/8690838/blog/18690372

4、基于极限网关实现 Elasticsearch 到 Easysearch 集群数据迁移实战
https://blog.csdn.net/yangmf20 ... 55265

5、Elasticsearch 的 JVM 基础知识:指标、内存和监控
https://elasticstack.blog.csdn ... 75147

编辑:Fred    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2108期 (2025-09-04)

社区日报Se7en 发表了文章 • 0 个评论 • 3072 次浏览 • 2025-09-04 13:56 • 来自相关话题

1.秒级集群翻转、分钟级IDC故障止损 | 同程大规模Elasticsearch平台架构设计与实践
https://mp.weixin.qq.com/s/fgVMx5JOw77JlNVSgh0UCw
2.Elastic 数据采集全面转向 OpenTelemetry
https://mp.weixin.qq.com/s/b8Wa1RKIyGB58o0RIcwweQ
3.Agent 架构综述:从 Prompt 到 Context
https://mp.weixin.qq.com/s/pIcZPDqYzXrE3i6Zh4sr-Q
4.玩疯了!盘点文生图模型Nano Banana的热门提示词
https://mp.weixin.qq.com/s/LOt-pZ7-cxXdf3KEmxpkWQ

编辑:Se7en
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2107期 (2025-09-03)

社区日报kin122 发表了文章 • 0 个评论 • 3415 次浏览 • 2025-09-03 13:26 • 来自相关话题

1.15分钟人工智能历史之旅(搭梯)
https://ai.plainenglish.io/a-1 ... 15228

2.欢迎来到AI幻觉博物馆(搭梯)
https://ai.plainenglish.io/wel ... 85827

3.利用 ElasticSearch 的强大功能进行 AirBnB 数据分析的分步指南(搭梯)
https://medium.com/%40ernestod ... 9d871



编辑:kin122    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2106期 (2025-09-02)

社区日报God_lockin 发表了文章 • 0 个评论 • 3911 次浏览 • 2025-09-02 08:21 • 来自相关话题

1. 手搓了个山寨ChatGPT系统不配个ES的可观测宇宙吗(需要梯子)
https://medium.com/%40contact2 ... c0d63

2. 这小哥在记录用Rust撸搜索引擎,码住先(需要梯子)
https://medium.com/@karri.balu2339

3. ILM 能让你的数据优雅的老去吗?(需要梯子)
https://medium.com/kocsistem/i ... 01ce8

编辑:斯蒂文
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2105期 (2025-09-01)

社区日报Muses 发表了文章 • 0 个评论 • 4033 次浏览 • 2025-09-01 12:17 • 来自相关话题

1、Observability:如何在隔离环境中部署 Elastic Agents
https://elasticstack.blog.csdn ... 40009

2、Elasticsearch:Semantic text 字段类型
https://elasticstack.blog.csdn ... 88674

3、使用 ES|QL COMPLETION + 一个 LLM 在 5 分钟内编写一个 Chuck Norris 事实生成器
https://elasticstack.blog.csdn ... 73787

4、将 agents 连接到 Elasticsearch 使用模型上下文协议 - docker
https://elasticstack.blog.csdn ... 51617

5、从炼金术到工程学:在AI浪潮中,我们如何告别RAG,拥抱真正的“上下文工程”?
https://mp.weixin.qq.com/s/bZbiMDnKMEvKx18MVTYkBA

编辑:Muse
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2104期 (2025-08-29)

社区日报Fred2000 发表了文章 • 0 个评论 • 4881 次浏览 • 2025-08-29 09:45 • 来自相关话题

1、Easysearch 冷热架构实战
https://blog.csdn.net/yangmf20 ... 11796

2、Elasticsearch 索引字段删除,除了 Reindex 重建索引还有没有别的解决方案?
https://mp.weixin.qq.com/s/IJxEQc59t4kn6ex_YGmYAQ

3、别被“资本炒作”带坑里了!AI搜索!=向量搜索、相关性!=相似性
https://mp.weixin.qq.com/s/dZb ... %3D16

4、APM 系列(一):Skywalking 与 Easyearch 集成
https://blog.csdn.net/yangmf20 ... 57384

5、Coco AI 嵌入式 AI 搜索 | 1分钟部署攻略
https://www.bilibili.com/video/BV17HZ4YoEpu/

编辑:Fred    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2103期 (2025-08-28)

社区日报Se7en 发表了文章 • 0 个评论 • 5062 次浏览 • 2025-08-28 20:59 • 来自相关话题

1.Claude Code 背后的秘密:为什么它能秒杀其他 AI 编程助手
https://mp.weixin.qq.com/s/6zDiDtnVwxNsqQjmkhZ-iA
2.基于 NVIDIA Dynamo 的分布式 LLM 推理:架构、特性与部署实践
https://b23.tv/o5EzNoV
3.我不给人做产品,给 Agent 做
https://mp.weixin.qq.com/s/gIHoE32VuvlXlGoLe5kCpg

编辑:Se7en
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2102期 (2025-08-27)

社区日报kin122 发表了文章 • 0 个评论 • 5234 次浏览 • 2025-08-27 13:21 • 来自相关话题

1.得物向量数据库落地实践
https://zhuanlan.zhihu.com/p/1936378091468461662

2.Elasticsearch:什么是神经网络?
https://elasticstack.blog.csdn ... 34162

3.向后索引:1930 年代词典编纂者如何使用索引卡构建矢量搜索(搭梯)
https://medium.com/%40mfbaig35 ... 439b0




编辑:kin122    
更多资讯:http://news.searchkit.cn