身安不如心安,屋宽不如心宽 。

专用master节点怎么配置xpack安全认证?

maconZou 回复了问题 • 2 人关注 • 2 个回复 • 1334 次浏览 • 2022-06-15 14:54 • 来自相关话题

单个segment设置多大、单个分片设置多少个segment合适呢?

Charele 回复了问题 • 2 人关注 • 2 个回复 • 2252 次浏览 • 2022-06-23 15:00 • 来自相关话题

Elasticsearch text类型 怎么进行 模糊查询

cdcd 回复了问题 • 3 人关注 • 2 个回复 • 2673 次浏览 • 2022-06-21 11:31 • 来自相关话题

Term和Wildcard联合使用时Wildcard出诡异了

feng_jiale 回复了问题 • 2 人关注 • 4 个回复 • 1662 次浏览 • 2022-06-08 16:38 • 来自相关话题

节点宕机数据丢失后部分分片无法分配 can not allocate

coding_hl 回复了问题 • 2 人关注 • 5 个回复 • 2366 次浏览 • 2022-06-09 16:05 • 来自相关话题

Elasticsearch:字段太多, 在 Elasticsearch 中防止映射爆炸的 3 种方法

liuxg 发表了文章 • 0 个评论 • 1830 次浏览 • 2022-06-07 12:22 • 来自相关话题

当一个系统具有三样东西时,它就被称为“可观察的”:日志、指标和跟踪。 虽然指标和跟踪具有可预测的数据结构,但日志(尤其是应用程序日志)通常是非结构化数据,需要收集和解析才能真正有用。 因此,控制日志可以说是实现可观察性最难的部分。如果你想了解如何把一个数据进行结构化,请参考我之前的文章 “Elasticsearch:Elastic可观测性 - 运用 pipeline 使数据结构化”。你可以在 “Elastic:开发者上手指南” 查找更多的文章。

在本文中,我们将深入探讨开发人员可以用来通过 Elasticsearch 管理日志的三种有效策略。

[相关文章:利用 Elastic 改善云中的数据管理和可观察性]

让 Elasticsearch 为你的数据工作
有时我们无法控制我们在集群中收到的日志类型。 想想一个日志分析提供商,它有一个特定的预算来存储其客户的日志,并且需要保持存储空间(Elastic 在咨询中处理了许多类似的案例)。

通常情况下,我们有客户索引字段 “以防万一” 他们需要用于搜索。 如果你是这种情况,那么以下技术在帮助你降低成本并将集群性能集中在真正重要的事情上应该被证明是有价值的。

让我们首先概述问题。 考虑以下具有三个字段的 JSON 文档:message、transaction.user、transaction.amount:

{
 "message": "2023-06-01T01:02:03.000Z|TT|Bob|3.14|hello",
 "transaction": {
   "user": "bob",
   "amount": 3.14
 }
}
将保存此类文档的索引的映射可能类似于以下内容:

PUT dynamic-mapping-test
{
 "mappings": {
   "properties": {
     "message": {
       "type": "text"
     },
     "transaction": {
       "properties": {
         "user": {
           "type": "keyword"
         },
         "amount": {
           "type": "long"
         }
       }
     }
   }
 }
}
但是,Elasticsearch 允许我们为新字段编制索引,而不必事先指定映射,这也是 Elasticsearch 易于使用的部分原因:我们可以轻松载入新数据。 因此,可以对偏离原始映射的内容进行索引,
 
更多阅读 https://elasticstack.blog.csdn ... 59151

elasticsearch 聚合的最大个数问题

Charele 回复了问题 • 2 人关注 • 1 个回复 • 1983 次浏览 • 2022-06-05 15:14 • 来自相关话题

关于FST的一些讨论

回复

Charele 回复了问题 • 1 人关注 • 8 个回复 • 2021 次浏览 • 2022-06-11 13:22 • 来自相关话题

elasticsearch client:rest-high-level gradle打包的时候skip

回复

zmc 发起了问题 • 1 人关注 • 0 个回复 • 1891 次浏览 • 2022-06-01 14:26 • 来自相关话题

elasticsearch es如何统计用户文档数量范围内容聚合?

Charele 回复了问题 • 5 人关注 • 3 个回复 • 3145 次浏览 • 2022-06-01 13:42 • 来自相关话题

求助 关于Elasticsearch的circuit_breaking_exception的问题

Charele 回复了问题 • 2 人关注 • 1 个回复 • 2069 次浏览 • 2022-05-28 15:54 • 来自相关话题

post_filter在es内部的执行流程是怎样的,它是怎么实现基于query的结果做二次筛选的

WiseLi1998 回复了问题 • 2 人关注 • 1 个回复 • 1639 次浏览 • 2024-11-14 14:21 • 来自相关话题

post_filter在es内部的执行流程是怎样的

medcl 回复了问题 • 3 人关注 • 2 个回复 • 1227 次浏览 • 2022-06-02 11:19 • 来自相关话题

Elasticsearch:如何部署 NLP:命名实体识别 (NER) 示例

liuxg 发表了文章 • 0 个评论 • 1825 次浏览 • 2022-05-27 11:24 • 来自相关话题

在本文章中,我们将通过一个示例,使用命名实体识别 (NER - Name Entity Recognition) NLP 模型来定位和提取非结构化文本字段中预定义的实体类别。 使用公开可用的模型,我们将向你展示如何将该模型部署到 Elasticsearch,使用新的 _infer API在文本中查找命名实体,并在提取管道中使用 NER 模型在文档被提取到 Elasticsearch 时提取实体。

NER 模型对于使用自然语言从全文字段中提取人物(people)、地点(places)和组织(organization)等实体很有用。

在此示例中,我们将通过 NER 模型运行《悲惨世界》一书的段落,并使用该模型从文本中提取字符和位置,并将它们之间的关系可视化。

更多关于 NLP 的阅读:

Elasticsearch:如何部署 NLP:文本嵌入和向量搜索

在 Elasticsearch 中使用 PyTorch 进行现代自然语言处理的介绍

Elasticsearch:如何部署 NLP:情绪分析示例

安装
如果你还没有安装好自己的 Elasticsearch,Kibana 及 Eland,那么请阅读之前的文章 “Elasticsearch:如何部署 NLP:文本嵌入和向量搜索”。

将 NER 模型部署到 Elasticsearch
首先,我们需要选择一个可以从文本字段中提取字符名称和位置的 NER 模型。 幸运的是,我们可以在 Hugging Face 上选择一些可用的 NER 模型,并查看 Elastic 文档,我们看到一个 uncased NER model from Elastic  模型。

现在我们已经选择了要使用的 NER 模型,我们可以使用 Eland 来安装模型。 在本例中,我们将通过 docker 镜像运行 Eland 命令,但首先我们必须通过克隆 Eland GitHub 存储库来构建 docker 镜像,并在你的客户端系统上创建 Eland 的 docker 镜像。详细步骤请在文章  “Elasticsearch:如何部署 NLP:文本嵌入和向量搜索”。中进行查看,这里就不再赘述了。

我们接下来使用如下的命令来上传模型:

docker run -it --rm elastic/eland \
    eland_import_hub_model \
      --url https://elastic:lOwgBZT3KowJrQ ... 9200/ \
      --hub-model-id elastic/distilbert-base-uncased-finetuned-conll03-english \
      --task-type ner \
      --insecure \
      —-start 
注意:请根据自己的用户账号信息更新 --url 选项中的 Elasticsearch 信息。由于我们使用的是自签名的证书部署的,在这里,我们使用 --insecure 来规避 SSL 签名证书的检查。

由于我们在 eland import 命令末尾使用了 --start 选项,因此 Elasticsearch 会将模型部署到所有可用的机器学习节点并将模型加载到内存中。 如果我们有多个模型并且想要选择要部署的模型,我们可以使用 Kibana 的机器学习 > 模型管理用户界面来管理模型的启动和停止。

原文链接:https://blog.csdn.net/UbuntuTo ... 77711

504 Gateway Time-out

回复

yqbboy 发起了问题 • 1 人关注 • 0 个回复 • 2173 次浏览 • 2022-05-27 09:17 • 来自相关话题