【搜索客社区日报】第1874期(2024-08-05)
社区日报 • Muses 发表了文章 • 0 个评论 • 2427 次浏览 • 2024-08-05 08:18
https://xie.infoq.cn/article/a ... e29b0
2、大模型与数据库:AI 时代的双向助推力
https://blog.csdn.net/OpenPie/ ... 98383
3、李飞飞团队发布《2024年人工智能指数报告》:10大趋势,揭示AI大模型喜与忧
https://www.thepaper.cn/newsDe ... 45165
4、大杀器!多Agent系统进入自动化编程领域,程序员会失业吗
https://blog.csdn.net/kiiy2/ar ... 7.235^v43^control&spm=1001.2101.3001.4242.1&utm_relevant_index=1
5、将成千上万的 Agent 连接起来,互相协作!智能体互联网 IoA 诞生了
https://blog.csdn.net/dQCFKyQD ... .5928
编辑:Muse
更多资讯:http://news.searchkit.cn
活动回顾 | 2024 搜索客社区 Meetup 首期线上直播活动圆满结束,附 PPT 下载
活动 • searchkit 发表了文章 • 0 个评论 • 2680 次浏览 • 2024-08-03 16:09
2024 年 7 月 31 日,由搜索客社区和极限科技(INFINI Labs)联合举办的首期线上 Meetup 技术交流直播活动圆满结束。本次直播活动吸引了超过 300 人次的技术爱好者参与,共同探讨了 Easysearch、大模型、RAG 等前沿技术和实践应用,为广大搜索技术爱好者提供了一个宝贵的学习和交流平台。
主题:Easysearch 结合大模型实现 RAG
本次Meetup活动我们邀请到了极限科技高级解决方案架构师、《老杨玩搜索》栏目 B站UP主 杨帆老师,为大家带来了主题为《Easysearch 结合大模型实现 RAG》精彩分享。
杨帆老师首先对 LangChain 进行了全面的介绍,包括其作用、组件构成和优势。接着,深入剖析了 RAG 技术的背景和局限性,探讨了 RAG 在信息获取方面的创新和挑战。在 LangChain 框架下,杨帆老师详细阐述了实现 RAG 的具体工作流程。最后通过 Demo 演示,展示了如何使用 Easysearch 结合大模型 ollama,实现企业内部 QA 知识问答系统。这一环节不仅展示了技术的实用性,也极大地激发了参会者的学习兴趣。
讲师分享过程中,直播间气氛非常活跃。参会者积极在直播间评论区留言,与讲师进行了深入的问答互动。同时,在互动环节中,主持人进行了激动人心的抽奖活动,将活动气氛推向了高潮,为参会小伙伴带来了额外的惊喜。
随着活动的圆满结束,参与者们不仅收获了丰富的技术知识和实际操作经验,还通过在线交流加深了对 Easysearch 和 RAG 的了解。这次 Meetup 为大家提供了一个分享和学习的平台,共同推动了技术的进步和社区的发展。
最后感谢大家的参与和支持,让我们共同期待下一次的 搜索客社区 Meetup 活动带来更多的精彩内容!
## 本期 Meetup 的 PPT 下载
本次 PPT 下载的链接:https://elasticsearch.cn/slides/324
## 本期 Meetup 视频回放
扫码关注极限实验室视频号查看直播回放,或者扫码关注极限实验室 B站账号,可查看本期Meetup活动视频。我们也会在视频号、B站持续更新最新技术视频,欢迎通过点赞、投币,收藏,三连来支持我们。
## 下期 Meetup 主题预告
## Meetup 活动讲师招募
![](https://elasticsearch.cn/uploa ... 0b.png)
搜索客社区 Meetup 的成功举办,离不开社区小伙伴的热情参与。目前社区讲师招募计划也在持续进行中,我们诚挚邀请各位技术大咖、行业精英踊跃提交演讲议题,与大家分享您的经验。
讲师报名链接:http://cfp.searchkit.cn
或扫描下方二维码,立刻报名成为讲师!
Meetup 活动聚焦 AI 与搜索领域的最新动态,以及数据实时搜索分析、向量检索、技术实践与案例分析、日志分析、安全等领域的深度探讨。
我们热切期待您的精彩分享!
【搜索客社区日报】第1873期 (2024-08-02)
社区日报 • Fred2000 发表了文章 • 0 个评论 • 2484 次浏览 • 2024-08-02 14:22
https://mp.weixin.qq.com/s/fhJfL9LX2SkcVqcuJ3RcYg
2、「最佳实践」借助网关双写,实现 Elasticsearch 的无缝在线迁移
https://cloud.tencent.com/deve ... 90434
3、Easysearch、Elasticsearch、Amazon OpenSearch 快照兼容对比
https://blog.csdn.net/weixin_3 ... 47448
4、DB 大咖对话 | 数据要素与人工智能对我国数据库技术和产业的影响
https://www.infoq.cn/article/OVogOUR5HtKoou9x8ugC
5、万字长文年中盘点,2024 上半年大模型技术突破与应用展望
https://xie.infoq.cn/article/d ... 9c6e2
编辑:Fred
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第1872期 (2024-08-01)
社区日报 • Se7en 发表了文章 • 0 个评论 • 2794 次浏览 • 2024-08-01 14:10
https://www.microsoft.com/en-u ... data/
2.Perplexity 牛逼!50 人团队年入 1.5 亿,这家 AI 独角兽如何在2年内撼动谷歌地位?
https://mp.weixin.qq.com/s/R-JczQeEsDJzV4YnpFCAPA
3.使用 OpenTelemetry 实现基于 LLM 的应用的可观测性介绍
https://mp.weixin.qq.com/s/Y0T4KUyJ3Fl0q5Zbz-bzOA
编辑:Se7en
更多资讯:http://news.searchkit.cn
【搜索客社区日报】 第1871期 (2024-07-31)
社区日报 • kin122 发表了文章 • 0 个评论 • 2816 次浏览 • 2024-07-31 12:27
https://ai.plainenglish.io/inv ... d8ca1
2.2800 份 AI 文档的检索增强生成 — 现场演示(搭梯)
https://medium.com/%40lamslide ... ff732
3.IK分词器原理
https://juejin.cn/post/6845166891120476168
编辑:kin122
更多资讯:http://news.searchkit.cn
match_phrase_prefix如何在term基础上匹配文本?
回复Elasticsearch • piemon 发起了问题 • 2 人关注 • 0 个回复 • 3500 次浏览 • 2024-07-30 14:12
【搜索客社区日报】第1870期 (2024-07-30)
社区日报 • God_lockin 发表了文章 • 0 个评论 • 2710 次浏览 • 2024-07-30 10:59
https://medium.com/%40zagfox/e ... 721a5
2. ES 里的相似性计算知多少
https://medium.com/%40shekhar. ... bf59c
3. Agent让大模型从“解释问题”到“解决问题”
https://zhuanlan.zhihu.com/p/7 ... r%3D0
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
Easysearch、Elasticsearch、Amazon OpenSearch 快照兼容对比
Easysearch • INFINI Labs 小助手 发表了文章 • 2 个评论 • 2479 次浏览 • 2024-07-29 11:54
在当今的数据驱动时代,搜索引擎的快照功能在数据保护和灾难恢复中至关重要。本文将对 Easysearch、Elasticsearch 和 Amazon OpenSearch 的快照兼容性进行比较,分析它们在快照创建、恢复、存储格式和跨平台兼容性等方面的特点,帮助大家更好地理解这些搜索引擎的差异,从而选择最适合自己需求的解决方案。
启动集群
Easysearch
服务器一般情况下默认参数都是很低的,而 Easysearch/Elasticsearch 是内存大户,所以就需要进行系统调优。
bash<br /> sysctl -w vm.max_map_count=262144<br />
vm.max_map_count
是一个 Linux 内核参数,用于控制单个进程可以拥有的最大内存映射区域(VMA,Virtual Memory Areas)的数量。内存映射区域是指通过内存映射文件或匿名内存映射创建的虚拟内存区域。
这个参数在一些应用程序中非常重要,尤其是那些需要大量内存映射的应用程序,比如 Elasticsearch。Elasticsearch 使用内存映射文件来索引和搜索数据,这可能需要大量的内存映射区域。如果 vm.max_map_count
设置得太低,Elasticsearch 可能无法正常工作,并会出现错误信息。
调整 vm.max_map_count
参数的一些常见原因:
- 支持大型数据集:
应用程序(如 Elasticsearch)在处理大型数据集时可能需要大量内存映射区域。增加vm.max_map_count
可以确保这些应用程序有足够的内存映射区域来处理数据。
- 防止内存错误:
如果vm.max_map_count
设置得太低,当应用程序尝试创建超过限制的内存映射时,会出现错误,导致应用程序崩溃或无法正常工作。
- 优化性能:
适当地设置vm.max_map_count
可以优化应用程序的性能,确保内存映射操作顺利进行。
检查当前的vm.max_map_count
值:
bash<br /> sysctl vm.max_map_count<br />
或者查看/proc/sys/vm/max_map_count
文件:
bash<br /> cat /proc/sys/vm/max_map_count<br />
Elasticsearch 官方建议将vm.max_map_count
设置为至少 262144。对于其他应用程序。
Easysearch 具体安装步骤见 [INFINI Easysearch 尝鲜 Hands on](https://blog.csdn.net/weixin_3 ... 077785)
Amazon OpenSearch
使用 Amazon Web Services 控制台进行创建。
Elasticsearch
使用如下 docker compose 部署一个三节点的 ES 集群:
```yml
version: "2.2"
services:
es01:
image: docker.elastic.co/elasticsearch/elasticsearch:7.10.2
container_name: es01
environment:- node.name=es01
- cluster.name=es-docker-cluster
- discovery.seed_hosts=es02,es03
- cluster.initial_master_nodes=es01,es02,es03
- bootstrap.memory_lock=true
- "ES_JAVA_OPTS=-Xms512m -Xmx512m"
ulimits:
memlock:
soft: -1
hard: -1
volumes: - data01:/usr/share/elasticsearch/data
ports: - 9200:9200
networks: - elastic
es02:
image: docker.elastic.co/elasticsearch/elasticsearch:7.10.2
container_name: es02
environment: - node.name=es02
- cluster.name=es-docker-cluster
- discovery.seed_hosts=es01,es03
- cluster.initial_master_nodes=es01,es02,es03
- bootstrap.memory_lock=true
- "ES_JAVA_OPTS=-Xms512m -Xmx512m"
ulimits:
memlock:
soft: -1
hard: -1
volumes: - data02:/usr/share/elasticsearch/data
networks: - elastic
es03:
image: docker.elastic.co/elasticsearch/elasticsearch:7.10.2
container_name: es03
environment: - node.name=es03
- cluster.name=es-docker-cluster
- discovery.seed_hosts=es01,es02
- cluster.initial_master_nodes=es01,es02,es03
- bootstrap.memory_lock=true
- "ES_JAVA_OPTS=-Xms512m -Xmx512m"
ulimits:
memlock:
soft: -1
hard: -1
volumes: - data03:/usr/share/elasticsearch/data
networks: - elastic
volumes:
data01:
driver: local
data02:
driver: local
data03:
driver: local
networks:
elastic:
driver: bridge
```
由于这个 docker compose 没有关于 kibana 的配置,所以我们还是用 Console 添加原生的 Elasticsearch 集群!
![](https://infinilabs.cn/img/blog ... /1.png)
集群信息
![](https://infinilabs.cn/img/blog ... /2.png)
快照还原的步骤
快照前的准备
插件安装
本次测试选择把索引快照备份到 Amazon S3,所以需要使用 S3 repository plugin,这个插件添加了对使用 Amazon S3 作为快照/恢复存储库的支持。
Easysearch 和 OpenSearch 集群自带了这个插件,所以无需额外安装。
对于自己部署的三节点 Elasticsearch 则需要进入每一个节点运行安装命令然后再重启集群,建议使用自动化运维工具来做这步,安装命令如下:
bash<br /> sudo bin/elasticsearch-plugin install repository-s3<br />
如果不再需要这个插件,可以这样删除。
bash<br /> sudo bin/elasticsearch-plugin remove repository-s3<br />
由于需要和 Amazon Web Services 打交道,所以我们需要设置 IAM 凭证,这个插件可以从 EC2 IAM instance profile,ECS task role 以及 EKS 的 Service account 读取相应的凭证。
对于托管的 Amazon OpenSearch 来说,我们无法在托管的 EC2 上绑定我们的凭证,所以需要新建一个 OpenSearchSnapshotRole,然后通过当前的用户把这个角色传递给服务,也就是我们说的 IAM:PassRole。
创建 OpenSearchSnapshotRole,策略如下:
bash<br /> {<br /> "Version": "2012-10-17",<br /> "Statement": [{<br /> "Action": [<br /> "s3:ListBucket"<br /> ],<br /> "Effect": "Allow",<br /> "Resource": [<br /> "arn:aws:s3:::bucket-name"<br /> ]<br /> },<br /> {<br /> "Action": [<br /> "s3:GetObject",<br /> "s3:PutObject",<br /> "s3:DeleteObject"<br /> ],<br /> "Effect": "Allow",<br /> "Resource": [<br /> "arn:aws:s3:::bucket-name/*"<br /> ]<br /> }<br /> ]<br /> }<br />
信任关系如下:
json<br /> {<br /> "Version": "2012-10-17",<br /> "Statement": [<br /> {<br /> "Effect": "Allow",<br /> "Principal": {<br /> "Service": "es.amazonaws.com"<br /> },<br /> "Action": "sts:AssumeRole"<br /> }<br /> ]<br /> }<br />
然后在我们的 IAM user 上加上 PassRole 的权限,这样我们就可以把 OpenSearchSnapshotRole 传递给 OpenSearch 集群。
json<br /> {<br /> "Version": "2012-10-17",<br /> "Statement": [<br /> {<br /> "Effect": "Allow",<br /> "Action": "iam:PassRole",<br /> "Resource": "arn:aws:iam::123456789012:role/OpenSearchSnapshotRole"<br /> }<br /> ]<br /> }<br />
注册存储库
在源集群执行注册
json<br /> PUT /_snapshot/snapshot-repo-name<br /> {<br /> "type": "s3",<br /> "settings": {<br /> "bucket": "<bucket-name>",<br /> "base_path": "<bucket-prefix>",<br />
在目标集群同样执行这个语句,为了防止覆盖源集群存储库的数据,将 "readonly": true 添加到"settings" PUT 请求中,这样就只有一个集群具有对存储库的写入权限。
json<br /> PUT /_snapshot/snapshot-repo-name<br /> {<br /> "type": "s3",<br /> "settings": {<br /> "bucket": "<bucket-name>",<br /> "base_path": "<bucket-prefix>",<br /> "readonly": true,<br />
对于 OpenSearch 来说,还需要执行 passrole,所以还需要添加role_arn这个字段,由于 IAM:PassRole 需要对 HTTP 请求做 signV4 日签名,所以这部常常使用 Postman 来完成。把角色传递过去之后,接下来的快照还原操作就可以在 OpenSearch Dashboard 中进行操作了。
![](https://infinilabs.cn/img/blog ... /3.png)
需要注意的是,需要在 auth 这里输入 AccessKey,SecretKey,AWS Region,Service Name(es)来做 SignV4 的签名。
![](https://infinilabs.cn/img/blog ... /4.png)
请求体如下:
json<br /> {<br /> "type": "s3",<br /> "settings": {<br /> "bucket": "<bucket-name>",<br /> "base_path": "<bucket-prefix>",<br /> "readonly": true,<br /> "role_arn": "arn:aws:iam::123456789012:role/OpenSearchSnapshotRole"<br /> }<br /> }<br />
- 查看所有注册的存储库:
GET _snapshot
:这个命令返回所有已注册的快照存储库列表及其基本信息。
sh<br /> GET _snapshot<br />
json<br /> {<br /> "es_repository": {<br /> "type": "s3",<br /> "settings": {<br /> "bucket": "your-s3-bucket-name",<br /> "region": "your-s3-bucket-region"<br /> }<br /> }<br /> }<br />
- 查看特定存储库的详细信息:
GET _snapshot/es_repository
:这个命令返回名为es_repository
的存储库的详细配置信息,包括存储桶名称、区域和其他设置。
sh<br /> GET _snapshot/es_repository<br />
json<br /> {<br /> "es_repository": {<br /> "type": "s3",<br /> "settings": {<br /> "bucket": "your-s3-bucket-name",<br /> "region": "your-s3-bucket-region",<br /> "access_key": "your-access-key",<br /> "secret_key": "your-secret-key"<br /> }<br /> }<br /> }<br />
- 查看特定存储库中的快照:
GET _cat/snapshots/es_repository?v
:这个命令返回es_repository
存储库中的所有快照及其详细信息,包括快照 ID、状态、开始时间、结束时间、持续时间、包含的索引数量、成功和失败的分片数量等。
sh<br /> GET _cat/snapshots/es_repository?v<br />
plaintext<br /> id status start_epoch start_time end_epoch end_time duration indices successful_shards failed_shards total_shards<br /> snapshot_1 SUCCESS 1628884800 08:00:00 1628888400 09:00:00 1h 3 10 0 10<br /> snapshot_2 SUCCESS 1628971200 08:00:00 1628974800 09:00:00 1h 3 10 0 10<br />
创建索引快照
```bashPUT _snapshot/my_repository/<mysnapshot{now/d}>
PUT _snapshot/my_repository/my_snapshot
{
"indices": "my-index,logs-my_app-default",
}
<br /> <br /> 根据快照的大小不同,完成快照可能需要一些时间。默认情况下,create snapshot API 只会异步启动快照过程,该过程在后台运行。要更改为同步调用,可以将 `wait_for_completion` 查询参数设置为 `true`。<br /> <br />
bash
PUT _snapshot/my_repository/my_snapshot?wait_for_completion=true
<br /> <br /> 另外还可以使用 clone snapshot API 克隆现有的快照。要监控当前正在运行的快照,可以使用带有 `_current` 请求路径参数的 get snapshot API。<br /> <br />
bash
GET _snapshot/my_repository/_current
<br /> <br /> 如果要获取参与当前运行快照的每个分片的完整详细信息,可以使用 get snapshot status API。<br /> <br />
bash
GET _snapshot/_status
<br /> <br /> 成功创建快照之后,就可以在 S3 上看到备份的数据块文件,这个是正确的快照层级结构:<br /> <br /> ![](<a href="https://infinilabs.cn/img/blog/2024/comparison-of-snapshot-compatibility-between-easysearch-elasticsearch-and-opensearch/5.pn" rel="nofollow" target="_blank">https://infinilabs.cn/img/blog ... /5.pn</a>g)<br /> <br /> 需要注意的是, "base_path": "<bucket-prefix>"这里最好不要加/,虽然不影响同集群迁移,这个会为我们在不同厂商的搜索引擎中迁移遇到问题,可能是这样的,所以需要注意。<br /> <br /> ![](<a href="https://infinilabs.cn/img/blog/2024/comparison-of-snapshot-compatibility-between-easysearch-elasticsearch-and-opensearch/6.pn" rel="nofollow" target="_blank">https://infinilabs.cn/img/blog ... /6.pn</a>g)<br /> <br /> 所以在 Open Search 中还原 Elasticsearch 就遇到了这个问题:<br /> <br />
json
{
"error": {
"root_cause": [
{
"type": "snapshot_missing_exception",
"reason": "[easy_repository:2/-jOQ0oucQDGF3hJMNz-vKQ] is missing"
}
],
"type": "snapshot_missing_exception",
"reason": "[easy_repository:2/-jOQ0oucQDGF3hJMNz-vKQ] is missing",
"caused_by": {
"type": "no_such_file_exception",
"reason": "Blob object [11111/indices/7fv2zAi4Rt203JfsczUrBg/meta-YGnzxZABRBxW-2vqcmci.dat] not found: The specified key does not exist. (Service: S3, Status Code: 404, Request ID: R71DDHX4XXM0434T, Extended Request ID: d9M/HWvPvMFdPhB6KX+wYCW3ZFqeFo9EoscWPkulOXWa+TnovAE5PlemtuVzKXjlC+rrgskXAus=)"
}
},
"status": 404
}
```
恢复索引快照
<br /> POST _snapshot/my_repository/my_snapshot_2099.05.06/_restore<br /> {<br /> "indices": "my-index,logs-my_app-default",<br /> }<br />
各个集群的还原
- 查看所有注册的存储库:
- node.name=es01
- Elasticsearch 7.10.2 的快照可以还原到 Easysearch 和 Amazon OpenSearch
- 从 Easysearch 1.8.2 还原到 Elasticsearch 7.10.2 报错如下:
json<br /> {<br /> "error": {<br /> "root_cause": [<br /> {<br /> "type": "snapshot_restore_exception",<br /> "reason": "[s3_repository:1/a2qV4NYIReqvgW6BX_nxxw] cannot restore index [my_indexs] because it cannot be upgraded"<br /> }<br /> ],<br /> "type": "snapshot_restore_exception",<br /> "reason": "[s3_repository:1/a2qV4NYIReqvgW6BX_nxxw] cannot restore index [my_indexs] because it cannot be upgraded",<br /> "caused_by": {<br /> "type": "illegal_state_exception",<br /> "reason": "The index [[my_indexs/ALlTCIr0RJqtP06ouQmf0g]] was created with version [1.8.2] but the minimum compatible version is [6.0.0-beta1]. It should be re-indexed in Elasticsearch 6.x before upgrading to 7.10.2."<br /> }<br /> },<br /> "status": 500<br /> }<br />
- 从 Amazon OpenSearch 2.1.3 还原到 Elasticsearch 7.10.2 报错如下(无论是否开启兼容模式):
json<br /> {<br /> "error": {<br /> "root_cause": [<br /> {<br /> "type": "snapshot_restore_exception",<br /> "reason": "[aos:2/D-oyYSscSdCbZFcmPZa_yg] the snapshot was created with Elasticsearch version [36.34.78-beta2] which is higher than the version of this node [7.10.2]"<br /> }<br /> ],<br /> "type": "snapshot_restore_exception",<br /> "reason": "[aos:2/D-oyYSscSdCbZFcmPZa_yg] the snapshot was created with Elasticsearch version [36.34.78-beta2] which is higher than the version of this node [7.10.2]"<br /> },<br /> "status": 500<br /> }<br />
- 从 Easysearch 1.8.2 还原到 Amazon OpenSearch2.13 报错如下(无论是否开启兼容模式):
json<br /> {<br /> "error": {<br /> "root_cause": [<br /> {<br /> "type": "snapshot_restore_exception",<br /> "reason": "[easy_repository:2/LE18AWHlRJu9rpz9BJatUQ] cannot restore index [my_indexs] because it cannot be upgraded"<br /> }<br /> ],<br /> "type": "snapshot_restore_exception",<br /> "reason": "[easy_repository:2/LE18AWHlRJu9rpz9BJatUQ] cannot restore index [my_indexs] because it cannot be upgraded",<br /> "caused_by": {<br /> "type": "illegal_state_exception",<br /> "reason": "The index [[my_indexs/VHOo7yfDTRa48uhQvquFzQ]] was created with version [1.8.2] but the minimum compatible version is OpenSearch 1.0.0 (or Elasticsearch 7.0.0). It should be re-indexed in OpenSearch 1.x (or Elasticsearch 7.x) before upgrading to 2.13.0."<br /> }<br /> },<br /> "status": 500<br /> }<br />
- Amazon OpenSearch 还原到 Easysearch 同样失败
json<br /> {<br /> "error": {<br /> "root_cause": [<br /> {<br /> "type": "snapshot_restore_exception",<br /> "reason": "[aoss:2/D-oyYSscSdCbZFcmPZa_yg] cannot restore index [aos] because it cannot be upgraded"<br /> }<br /> ],<br /> "type": "snapshot_restore_exception",<br /> "reason": "[aoss:2/D-oyYSscSdCbZFcmPZa_yg] cannot restore index [aos] because it cannot be upgraded",<br /> "caused_by": {<br /> "type": "illegal_state_exception",<br /> "reason": "The index [[aos/864WjTAXQCaxJ829V5ktaw]] was created with version [36.34.78-beta2] but the minimum compatible version is [6.0.0]. It should be re-indexed in Easysearch 6.x before upgrading to 1.8.2."<br /> }<br /> },<br /> "status": 500<br /> }<br />
- Elasticsearch 8.14.3 迁移到 Amazon OpenSearch 或者 Elasticsearch 都是有这个报错:
json<br /> {<br /> "error": {<br /> "root_cause": [<br /> {<br /> "type": "parsing_exception",<br /> "reason": "Failed to parse object: unknown field [uuid] found",<br /> "line": 1,<br /> "col": 25<br /> }<br /> ],<br /> "type": "repository_exception",<br /> "reason": "[snap] Unexpected exception when loading repository data",<br /> "caused_by": {<br /> "type": "parsing_exception",<br /> "reason": "Failed to parse object: unknown field [uuid] found",<br /> "line": 1,<br /> "col": 25<br /> }<br /> },<br /> "status": 500<br /> }<br />
这是由于 Elasticsearch 8 在创建快照的时候会默认加上一个 UUID 的字段,所以我们低版本的 Easysearch、Amazon OpenSearch 中会找不到这个字段,在执行GET _cat/snapshots/snap?v
的时候就报错,及时在注册存储库的时候显示加上 UUID 的字段也无事无补。
json<br /> {<br /> "snapshot-repo-name": {<br /> "type": "s3",<br /> "uuid": "qlJ0uqErRmW6aww2Fyt4Fg",<br /> "settings": {<br /> "bucket": "<bucket-name>",<br /> "base_path": "<bucket-prefix>",<br /> }<br /> },<br />
以下是兼容性对比,每行第一列代表源集群,第一行代表目标集群:
| 快照兼容对比 | Easysearch 1.8.2 | Elasticsearch 7.10.2 | OpenSearch 2.13 |
| -------------------- | ---------------- | -------------------- | --------------- |
| Easysearch 1.8.2 | 兼容 | 不兼容 | 不兼容 |
| Elasticsearch 7.10.2 | 兼容 | 兼容 | 兼容 |
| OpenSearch 2.13 | 不兼容 | 不兼容 | 兼容 |
Elasticsearch 的兼容列表官方的列表如下:
![](https://infinilabs.cn/img/blog ... /7.png)
参考文献
- 开始使用 Elastic Stack 和 Docker Compose:第 1 部分
https://www.elastic.co/cn/blog ... mpose
- Docker Compose 部署多节点 Elasticsearch
https://www.elastic.co/guide/e ... -file
- repository-s3 教程
https://www.elastic.co/guide/e ... .html
https://www.elastic.co/guide/e ... .html
- snapshot-restore
https://www.elastic.co/guide/e ... .html
- 在亚马逊 OpenSearch 服务中创建索引快照
https://docs.amazonaws.cn/zh_c ... store
- 教程:迁移至 Amazon OpenSearch Service
https://docs.amazonaws.cn/zh_c ... .html
关于 Easysearch 有奖征文活动
![黑神话悟空](https://infinilabs.cn/img/blog ... er.png)
无论你是 Easysearch 的老用户,还是第一次听说这个名字,只要你对 INFINI Labs 旗下的 Easysearch 产品感兴趣,或者是希望了解 Easysearch,都可以参加这次活动。
详情查看:[Easysearch 征文活动](/https://infinilabs.cn/blog/202 ... ukong/)
作者:韩旭,亚马逊云技术支持,亚马逊云科技技领云博主,目前专注于云计算开发和大数据领域。
原文:https://infinilabs.cn/blog/202 ... arch/
使用 Easysearch 打造企业内部知识问答系统
Easysearch • INFINI Labs 小助手 发表了文章 • 0 个评论 • 2353 次浏览 • 2024-07-29 11:08
大家可能都有这样的经历,刚入职一家企业时,同事往往会给你分享一些文档资料,有可能是产品信息、规章制度等等。这些文档有的过于冗长,很难第一时间找到想要的内容。有的已经有了新版本,但员工使用的还是老版本。
基于这种背景,我们可以利用 Easysearch 加 LLM 实现一个内部知识的 QA 问答系统。这个系统将利用 LangChain 框架调用本地部署的大模型和 Easysearch,实现理解员工的提问,并基于最新的文档,给出精准答案。
开发框架
![](https://infinilabs.cn/img/blog ... ge.png)
整个框架分为四个部分:
- 数据源:数据可以有很多种,可以是非结构化的,比如 PDF、docx、txt 等。也可以是结构化的数据,甚至代码也行。在本次示例中,我们使用 PDF 的非结构化数据。
- 大模型应用:应用与大模型交互,生成我们需要的答案。
- 大模型:系统执行相关任务需要用到的大模型,可以有多个。
- Q&A 场景:基于大模型为引擎的 QA 场景,使用 web 框架,构建一个交互界面。
数据准备
本次我们使用的资料是 "INFINI 产品安装手册.pdf" ,文档部分内容展示如下:
![](https://infinilabs.cn/img/blog ... e1.png)
首先我们使用 LangChain 的 document_loaders 来加载文件。document_loaders 集成了数百种数据源格式,可以很方便的加载数据。我们的数据的 pdf 格式的,导入 PyPDFLoader 类来进行处理。代码如下:
```python
import os
导入 Document Loaders
from langchain_community.document_loaders import PyPDFLoader
Load Pdf
base_dir = '.\easysearch' # 文档的存放目录
docs = []
for file in os.listdir(base_dir):
file_path = os.path.join(base_dir, file)
if file.endswith('.pdf'):
loader = PyPDFLoader(file_path)
documents.extend(loader.load())
```
上面的代码将 pdf 文件的内容存储在 docs 这个列表中,以便后续进行处理。
文本分割
一个文件的文本内容可能很大,无法适应许多模型的上下文窗口,也不利于检索和存储。因此,通常我们会将文本内容分割成更小的块,这将帮助我们在运行时只检索文档中最相关的部分。LangChain 提供了工具来进行处理文本分割,非常方便。
我们将把文档分割成 1000 个字符的块,每个块之间有 200 个重叠字符。这种重叠有助于减少将语句与相关的重要上下文分离的可能性。
```python2.将Documents切分成块
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=20)
chunked_documents = text_splitter.split_documents(docs)
```
上面的代码将 docs 的内容按 1000 字符大小进行切分,存储在 chunked_documents 中,以便后续进行处理。
注意,实际运行中,切分及重叠的大小,都会影响应用效果,需自行调试。
向量库 Easysearch
接下来,我们将这些文本块转换成向量的形式,并存储在一个向量数据库中。在本示例中,我们使用 mxbai-embed-large 模型来生成向量,然后将向量和原始内容存入 easysearch 。
本地部署模型,我使用的是 ollama ,大家可以使用自己喜欢的工具。
```python3. 定义embedding模型
from langchain_community.embeddings import OllamaEmbeddings
ollama_emb = OllamaEmbeddings(
model="mxbai-embed-large",
)
4. 定义 easysearch 集群的信息,以及存放向量的索引名称 infini
from langchain_community.vectorstores import EcloudESVectorStore
ES_URL = "<a href="https://192.168.56.3:9200"" rel="nofollow" target="_blank">https://192.168.56.3:9200"
USER = "admin"
PASSWORD = "e5ac1b537785ae27c187"
indexname = "infini"
docsearch = EcloudESVectorStore.from_documents(
chunked_documents,
ollama_emb,
es_url=ES_URL,
user=USER,
password=PASSWORD,
index_name=indexname,
verify_certs=False,
)
```
通过上面的步骤,我们成功将文本块转换成了向量,并存入到了 easysearch 集群的 infini 索引中。
![](https://infinilabs.cn/img/blog ... e2.png)
我们看看 infini 索引内容是怎样的
![](https://infinilabs.cn/img/blog ... e3.png)
text 字段存放了文本块的原始内容,vector 字段存放着对应的向量表示。
检索及生成答案
在这一步,我们会定义一个生成式大模型。然后创建一个 RetrievalQA 链,它是一个检索式问答模型,用于生成问题的答案。
在 RetrievalQA 链中有下面两大重要组成部分。
- LLM 是大模型,负责回答问题。
- retriever(vectorstore.as_retriever())负责根据用户的问题检索相关的信息。先是找最近似的“向量块”,再把”向量块“对应的“文档块”作为知识信息,和问题一起传递进入大模型。之所以要先检索,是因为从互联网信息训练而来的大模型不可能拥有一个私营企业的内部知识。
```python
5. Retrieval 准备模型和Retrieval链
import logging
MultiQueryRetriever工具
from langchain.retrievers.multi_query import MultiQueryRetriever
RetrievalQA链
from langchain.chains import RetrievalQA
设置Logging
logging.basicConfig()
logging.getLogger('langchain.retrievers.multi_query').setLevel(logging.INFO)
实例化一个大模型工具
from langchain_community.chat_models import ChatOllama
llm = ChatOllama(model="qwen2:latest")
from langchain.prompts import PromptTemplate
my_template = PromptTemplate(
input_variables=["question"],
template="""You are an AI language model assistant. Your task is
to generate 3 different versions of the given user
question in Chinese to retrieve relevant documents from a vector database.
By generating multiple perspectives on the user question,
your goal is to help the user overcome some of the limitations
of distance-based similarity search. Provide these alternative
questions separated by newlines. Original question: {question}""",
)
实例化一个MultiQueryRetriever
retriever_from_llm = MultiQueryRetriever.from_llm(retriever=docsearch.as_retriever(), llm=llm,prompt=my_template,include_original=True)
实例化一个RetrievalQA链
qa_chain = RetrievalQA.from_chain_type(llm,retriever=retriever_from_llm)
``<br /> <br /> 这里我们使用 ollama 在本地部署一个 qwen2 大模型,负责问题改写和生成答案。<br /> <br /> 启动 qwen2 大模型:
ollama run qwen2`
![](https://infinilabs.cn/img/blog ... e4.png)
我们获取到用户问题后,先通过 MultiQueryRetriever 类调用大模型 qwen2 进行改写,生成 3 个同样语义的问题,然后再调用 easyearch 进行向量检索,搜索相关内容。
最后把所有相关内容,合并、去重后,与原始问题一起提交给大模型 qwen2,进行答案生成。
虽然这里使用的是向量检索,但实际上我们可以同时使用全文检索和向量检索。这也是使用 easysearch 作为检索库的优势之一。
前端展示
这一步我们创建一个 Flask 应用(需要安装 Flask 包)来接收用户的问题,并生成相应的答案,最后通过 index.html 对答案进行渲染和呈现。
在这个步骤中,我们使用了之前创建的 RetrievalQA 链来获取相关的文档和生成答案。然后,将这些信息返回给用户,显示在网页上。
```python6. Q&A系统的UI实现
from flask import Flask, request, render_template
app = Flask(name) # Flask APP
@app.route('/', methods=['GET', 'POST'])
def home():
if request.method == 'POST':
接收用户输入作为问题
question = request.form.get('question')<br />
RetrievalQA链 - 读入问题,生成答案
result = qa_chain({"query": question})<br />
把大模型的回答结果返回网页进行渲染
return render_template('index.html', result=result)<br />
return render_template('index.html')
if name == "main":
app.run(host='0.0.0.0',debug=True,port=5000)
```
效果演示
我们模仿用户进行提问。
![](https://infinilabs.cn/img/blog ... e5.png)
Q&A 系统进行回答,回答速度取决于本地的计算资源。
![](https://infinilabs.cn/img/blog ... e6.png)
内容校验,在原始文档内用 ctrl+F 搜索关键字 LOGGING_ES_ENDPOINT 得到如下内容。
![](https://infinilabs.cn/img/blog ... e7.png)
嗯,回答的还不错,达到预期目的。如果还有其他要求,可修改 my_template 中的提示词或者替换成别的大模型也是可以的。
小结
通过这次示例,我们演示了如何基于 LangChain 和 easysearch 以及大模型,快速开发出一个内部知识问答系统。怎么样,是不是觉得整个流程特别简单易懂?
如有任何问题,请随时联系我,期待与您交流!
![](https://infinilabs.cn/img/blog ... gf.png)
关于 Easysearch 有奖征文活动
![黑神话悟空](https://infinilabs.cn//img/blo ... er.png)
无论你是 Easysearch 的老用户,还是第一次听说这个名字,只要你对 INFINI Labs 旗下的 Easysearch 产品感兴趣,或者是希望了解 Easysearch,都可以参加这次活动。
详情查看:[Easysearch 征文活动](https://infinilabs.cn/blog/202 ... ukong/)
【搜索客社区日报】第1869期 (2024-07-29)
社区日报 • Muses 发表了文章 • 0 个评论 • 2270 次浏览 • 2024-07-29 09:26
https://infinilabs.cn/blog/202 ... arch/
2. Timeplus Proton现已原生支持面向ClickHouse的流式处理和ETL
https://mp.weixin.qq.com/s/wygAiRSSaXH06MOP6TZ_BA
3. 有关世界最新的新闻和建议
https://www.zdnet.com/
4. 理解近似最近邻 (ANN) 算法
https://www.elastic.co/cn/blog/understanding-ann
5. 什么是量子技术?它为何重要?
https://blog.emb.global/impact ... logy/
编辑:Muse
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第1868期 (2024-07-26)
社区日报 • searchkit 发表了文章 • 0 个评论 • 2509 次浏览 • 2024-07-26 12:10
https://mp.weixin.qq.com/s/dSUEbsZ3gOmLEkQk--RJZw
2、最近硅谷人人都在讨论的GraphRAG到底是什么
https://mp.weixin.qq.com/s/Hx_nZItbwBL0XxckGnyXLg
3、减少 95% 资源的向量搜索 | 使用云搜索的 DiskANN
https://mp.weixin.qq.com/s/ddAv8X4qHKgfgpBkavLCPA
4、OpenSearch 向量检索和大模型方案深度解读
https://blog.51cto.com/u_15316473/8598095
🎉 活动预告:
【7月31日】第1期 | 2024 搜索客社区 Meetup 线上直播活动,主题:《Easysearch 结合大模型实现 RAG》
https://searchkit.cn/article/15209
编辑:Fred
更多资讯:http://news.searchkit.cn
【第1期】2024 搜索客 Meetup | Easysearch 结合大模型实现 RAG
活动 • searchkit 发表了文章 • 0 个评论 • 2846 次浏览 • 2024-07-25 16:57
2024 搜索客社区 Meetup 首期线上活动正式启动,本次活动由 搜索客社区、极限科技(INFINI Labs)联合举办,诚邀广大搜索技术开发者和爱好者参加交流学习。
活动时间:2024 年 7 月 31 日 19:00-20:00 (周三)
活动形式:微信视频号(极限实验室)直播
报名方式:关注或扫码海报中的二维码进行预约
![活动海报](https://infinilabs.cn/img/blog ... /1.png)
活动简介
在这个人工智能飞速发展的时代,ChatGPT 和 GPT-4 的出现无疑为人类带来了前所未有的震撼。我们不禁思考:通用人工智能的奇点是否真的即将来临?而最前沿的 AI 技术与最实用的落地应用之间的距离,又该如何缩短?
为了深入探讨这些问题,我们特别邀请到了极限科技(INFINI Labs)高级解决方案架构师、《老杨玩搜索》栏目 B 站 UP 主——杨帆先生,为我们带来一场主题为 “Easysearch 结合大模型实现 RAG” 的精彩演讲。
嘉宾介绍
杨帆,拥有十余年金融行业服务工作经验,熟悉 Linux、数据库、网络等领域。目前主要从事 Easysearch、Elasticsearch 等搜索引擎的技术支持工作,服务国内私有化部署的客户。他的丰富经验和深刻见解,将为我们揭开 AI 技术与实际应用之间的神秘面纱。
演讲主题
《Easysearch 结合大模型实现 RAG》
主题摘要
在本次演讲中,杨帆将跟大家分享和探讨以下几个方面:
- LangChain 简介:LangChain 的作用是什么?它由哪些组件构成,优势是什么。
- RAG 的背景及其局限性:RAG 出现以前的我们是如何获取信息的,RAG 解决了什么问题?它就是最终的答案了吗?
- LangChain 下的 RAG 工作流:在 LangChain 的框架下,实现 RAG 的步骤是怎样的。
- RAG Demo:使用 ollama 部署本地模型,利用 LangChain 集成 Easysearch 和 LLM , 开发 QA 问答系统
活动亮点
- 前沿技术分享: 深入了解当前 AI 领域的最新动态和发展趋势。
- 实战经验交流: 学习如何在实际工作中应用这些先进技术。
- 互动问答环节: 与演讲嘉宾直接对话,解答你的疑惑。
参与有奖
本次直播活动中设置了随机抽奖环节,奖品为 INFINI Labs 周边纪念品,包括 T 恤、鸭舌帽、咖啡杯、指甲刀套件等等(图片仅供参考,款式、颜色与尺码随机)。
![抽奖礼品](https://infinilabs.cn/img/blog ... ts.png)
活动交流
活动交流群二维码 7 天内(8 月 1 日前)有效,如过期请添加小助手微信拉群。活动最新消息也会在群内及时同步,欢迎大家参与,记得先预约,精彩内容不错过!
![活动交流](https://infinilabs.cn/img/blog ... /2.jpg)
讲师招募
![讲师招募](https://infinilabs.cn/img/blog ... ng.png)
搜索客社区 Meetup 讲师持续招募中...
这是一个由搜索客社区精心组织策划的线下线上技术交流活动,我们诚挚邀请各位技术大咖、行业精英踊跃提交演讲议题。Meetup 活动将聚焦 AI 与搜索领域的最新动态,以及数据实时搜索分析、向量检索、技术实践与案例分析、日志分析、安全等领域的深度探讨。详情参见:[http://cfp.searchkit.cn](http://cfp.searchkit.cn) 。我们热切期待您的精彩分享!
关于 搜索客(SearchKit)社区
搜索客社区由 Elasticsearch 中文社区进行全新的品牌升级,以新的 Slogan:“搜索人自己的社区” 为宣言。汇集搜索领域最新动态、精选干货文章、精华讨论、文档资料、翻译与版本发布等,为广大搜索领域从业者提供更为丰富便捷的学习和交流平台。社区官网:[https://searchkit.cn](https://searchkit.cn) 。
Easysearch 有奖征文活动推荐
![黑神话悟空](https://infinilabs.cn//img/blo ... er.png)
无论你是 Easysearch 的老用户,还是第一次听说这个名字,只要你对 INFINI Labs 旗下的 Easysearch 产品感兴趣,或者是希望了解 Easysearch,都可以参加这次活动。
详情查看:[Easysearch 征文活动](https://infinilabs.cn/blog/202 ... ukong/)
- 前沿技术分享: 深入了解当前 AI 领域的最新动态和发展趋势。
【搜索客社区日报】第1867期 (2024-07-25)
社区日报 • Se7en 发表了文章 • 0 个评论 • 2450 次浏览 • 2024-07-25 12:57
https://mp.weixin.qq.com/s/yXz5kuiUNQFdTUdHQITL2Q
2.开源仅 1 天就斩获近万星!超越 RAG、让大模型拥有超强记忆力的 Mem0 火了!
https://mp.weixin.qq.com/s/ZJUD2n5RZ6XCF3aZ53SpGw
3.MySQL新版恶性Bug,表太多就崩给你看
https://mp.weixin.qq.com/s/LTlR65SY7ZOpPFGH0kUsVg
编辑:Se7en
更多资讯:http://news.searchkit.cn
【搜索客社区日报】 第1866期 (2024-07-24)
社区日报 • kin122 发表了文章 • 0 个评论 • 2365 次浏览 • 2024-07-24 20:46
https://mp.weixin.qq.com/s/z8CcFi03kQMGoEEQbuHzxw
2.Elasticsearch 中的位向量
https://blog.csdn.net/UbuntuTo ... 22765
3.介绍 Elasticsearch 中的 Learning to Tank - 学习排名
https://blog.csdn.net/UbuntuTo ... 64162
编辑:kin122
更多资讯:http://news.searchkit.cn
es8使用版本7的Rest-High-Level-client失败
Elasticsearch • biltong 回复了问题 • 2 人关注 • 3 个回复 • 3180 次浏览 • 2024-09-13 17:12