使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。

社区日报 第1412期 (2022-06-01)

社区日报kin122 发表了文章 • 0 个评论 • 1155 次浏览 • 2022-06-01 10:18 • 来自相关话题

1. Elasticsearch查询——Profile API
https://blog.csdn.net/qq330983 ... 57930
2. match 查询中 minimum_should_match 的使用方式(需要梯子)
https://medium.com/%40sean1223 ... 09f3d
3. ES 中 disjunction max 查询的使用(需要梯子)
https://medium.com/%40sean1223 ... d9ac9

编辑:kin122
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

社区日报 第1411期 (2022-05-31)

社区日报God_lockin 发表了文章 • 0 个评论 • 1115 次浏览 • 2022-05-31 10:11 • 来自相关话题


1. 保姆级ES dsl 教学(需要梯子)
https://medium.com/geekculture ... 10c0e

2. 谁会是Kibana的planB?(需要梯子)
https://medium.com/geekculture ... 14e00

3. 我可以在k8s上部署ES吗(需要梯子)
https://medium.com/99dotco/a-d ... 60466

编辑:斯蒂文
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

社区日报 第1410期 (2022-05-30)

社区日报yuebancanghai 发表了文章 • 0 个评论 • 1072 次浏览 • 2022-05-30 14:35 • 来自相关话题


1. Elasticsearch架构解析与最佳实践
   https://zhuanlan.zhihu.com/p/157964955

2. Elasticsearch 理解搜索中的 precision 及 recall
   https://blog.csdn.net/UbuntuTo ... 12610

3. Elasticsearch 百度NLP中文分词插件
   https://cloud.baidu.com/doc/BES/s/Lke3o72jg

编辑:yuebancanghai
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

社区日报 第1409期 (2022-05-29)

社区日报cyberdak 发表了文章 • 0 个评论 • 1027 次浏览 • 2022-05-29 17:13 • 来自相关话题

1. Elasticsearch 企业级安全扩展:readonlyrest
https://readonlyrest.com/
2. Elasticsearch 流行工具清单
https://github.com/dzharii/awesome-elasticsearch
 
3. Elasticsearch 在机器学习上的应用
https://www.modb.pro/db/69770

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

社区日报 第1408期 (2022-05-28)

社区日报jingli 发表了文章 • 1 个评论 • 1047 次浏览 • 2022-05-28 19:45 • 来自相关话题

1、 elasticsearch-spark 的用法
https://www.cnblogs.com/w15706 ... .html
2、利用 Elasticsearch 实现类主流搜索引擎广告置顶显示效果
https://blog.csdn.net/weixin_4 ... 42338
3、Elasticsearch 运维实践
https://www.modb.pro/db/403820
 
编辑:李静
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

elasticsearch es如何统计用户文档数量范围内容聚合?

ElasticsearchCharele 回复了问题 • 5 人关注 • 3 个回复 • 3166 次浏览 • 2022-06-01 13:42 • 来自相关话题

求助 关于Elasticsearch的circuit_breaking_exception的问题

ElasticsearchCharele 回复了问题 • 2 人关注 • 1 个回复 • 2101 次浏览 • 2022-05-28 15:54 • 来自相关话题

post_filter在es内部的执行流程是怎样的,它是怎么实现基于query的结果做二次筛选的

ElasticsearchWiseLi1998 回复了问题 • 2 人关注 • 1 个回复 • 1658 次浏览 • 2024-11-14 14:21 • 来自相关话题

docker部署elk+filebeat 无法抓取日志

BeatsAPaul 回复了问题 • 2 人关注 • 1 个回复 • 2036 次浏览 • 2022-08-03 14:32 • 来自相关话题

post_filter在es内部的执行流程是怎样的

Elasticsearchmedcl 回复了问题 • 3 人关注 • 2 个回复 • 1232 次浏览 • 2022-06-02 11:19 • 来自相关话题

Elasticsearch:如何部署 NLP:命名实体识别 (NER) 示例

Elasticsearchliuxg 发表了文章 • 0 个评论 • 1837 次浏览 • 2022-05-27 11:24 • 来自相关话题

在本文章中,我们将通过一个示例,使用命名实体识别 (NER - Name Entity Recognition) NLP 模型来定位和提取非结构化文本字段中预定义的实体类别。 使用公开可用的模型,我们将向你展示如何将该模型部署到 Elasticsearch,使用新的 _infer API在文本中查找命名实体,并在提取管道中使用 NER 模型在文档被提取到 Elasticsearch 时提取实体。

NER 模型对于使用自然语言从全文字段中提取人物(people)、地点(places)和组织(organization)等实体很有用。

在此示例中,我们将通过 NER 模型运行《悲惨世界》一书的段落,并使用该模型从文本中提取字符和位置,并将它们之间的关系可视化。

更多关于 NLP 的阅读:

Elasticsearch:如何部署 NLP:文本嵌入和向量搜索

在 Elasticsearch 中使用 PyTorch 进行现代自然语言处理的介绍

Elasticsearch:如何部署 NLP:情绪分析示例

安装
如果你还没有安装好自己的 Elasticsearch,Kibana 及 Eland,那么请阅读之前的文章 “Elasticsearch:如何部署 NLP:文本嵌入和向量搜索”。

将 NER 模型部署到 Elasticsearch
首先,我们需要选择一个可以从文本字段中提取字符名称和位置的 NER 模型。 幸运的是,我们可以在 Hugging Face 上选择一些可用的 NER 模型,并查看 Elastic 文档,我们看到一个 uncased NER model from Elastic  模型。

现在我们已经选择了要使用的 NER 模型,我们可以使用 Eland 来安装模型。 在本例中,我们将通过 docker 镜像运行 Eland 命令,但首先我们必须通过克隆 Eland GitHub 存储库来构建 docker 镜像,并在你的客户端系统上创建 Eland 的 docker 镜像。详细步骤请在文章  “Elasticsearch:如何部署 NLP:文本嵌入和向量搜索”。中进行查看,这里就不再赘述了。

我们接下来使用如下的命令来上传模型:

docker run -it --rm elastic/eland \
    eland_import_hub_model \
      --url https://elastic:lOwgBZT3KowJrQ ... 9200/ \
      --hub-model-id elastic/distilbert-base-uncased-finetuned-conll03-english \
      --task-type ner \
      --insecure \
      —-start 
注意:请根据自己的用户账号信息更新 --url 选项中的 Elasticsearch 信息。由于我们使用的是自签名的证书部署的,在这里,我们使用 --insecure 来规避 SSL 签名证书的检查。

由于我们在 eland import 命令末尾使用了 --start 选项,因此 Elasticsearch 会将模型部署到所有可用的机器学习节点并将模型加载到内存中。 如果我们有多个模型并且想要选择要部署的模型,我们可以使用 Kibana 的机器学习 > 模型管理用户界面来管理模型的启动和停止。

原文链接:https://blog.csdn.net/UbuntuTo ... 77711

504 Gateway Time-out

回复

Elasticsearchyqbboy 发起了问题 • 1 人关注 • 0 个回复 • 2189 次浏览 • 2022-05-27 09:17 • 来自相关话题

keyword类型的数字的大于小于查询

Elasticsearchlaoyang360 回复了问题 • 3 人关注 • 3 个回复 • 2920 次浏览 • 2022-05-29 15:02 • 来自相关话题

Elasticsearch:Elastic Maps 现在支持机器学习异常层

Elasticsearchliuxg 发表了文章 • 0 个评论 • 1089 次浏览 • 2022-05-26 11:40 • 来自相关话题

现在可以在 Elastic Maps 中查看使用 geographical functions 的机器学习 (ML) 异常检测作业的结果。 Elastic Maps 8.1.0 版本可以按位置生成异常地图,帮助你探索数据中的新趋势。

Elastic Maps 在 Elastic Cloud 上可用。 你还可以下载 Elastic Stack 和我们的云编排产品 Elastic Cloud Enterprise (ECE) 和 Elastic Cloud for Kubernetes (ECK),以获得自我管理的体验。

在此示例中,我们将使用通用运输饲料规范 (GTFS) 数据。 GTFS 定义了公共交通时刻表和相关地理信息的通用格式。

在下面的展示中,我将使用 Elastic Stack 8.2 来进行展示。

Geographical functions
地理功能检测输入数据的地理位置异常。lat_long 函数检测输入数据的地理位置异常。

注意:你不能为包含地理函数的异常检测作业创建预测。 你也不能将带有条件的规则添加到使用地理函数的检测器中。

该函数支持以下属性:

field_name (required)
by_field_name (optional)
over_field_name (optional)
partition_field_name (optional)
比如,我们在如下的例子中,使用 lat_long 函数来分析信用卡交易的异常:

PUT _ml/anomaly_detectors/example1
{
  "analysis_config": {
    "detectors": [{
      "function" : "lat_long",
      "field_name" : "transaction_coordinates",
      "by_field_name" : "credit_card_number"
    }]
  },
  "data_description": {
    "time_field":"timestamp",
    "time_format": "epoch_ms"
  }
}
我们知道,在通常的情况下,你的信用卡不可能在一个很小的时间范围里,在美国和中国同时耍卡,除非飞机飞的真的很快很快。如果你在异常检测作业的检测器中使用此 lat_long 函数,它会检测到信用卡交易的地理位置对于特定客户的信用卡而言的异常。 异常可能表明存在欺诈。

重要:你提供的 field_name 必须是一个字符串,其中包含两个逗号分隔的数字,格式为纬度、经度、geo_point 字段、包含点值的 geo_shape 字段或 geo_centroid 聚合。 纬度和经度必须在 -180 到 180 的范围内,并且代表地球表面上的一个点。

比如,JSON 数据可能包含以下交易坐标:

{
  "time": 1460464275,
  "transaction_coordinates": "40.7,-74.0",
  "credit_card_number": "1234123412341234"
}
在 Elasticsearch 中,位置数据很可能存储在 geo_point 字段中。 有关详细信息,请参阅 geo_point 数据类型。 机器学习功能原生支持此数据类型。 具体来说,当从 geo_point 字段中提取数据时,datafeed 将在发送到异常检测作业之前将数据转换为适当的纬度、经度字符串格式。
Elasticsearch:Elastic Maps 现在支持机器学习异常层原文链接:https://blog.csdn.net/UbuntuTo ... 58783

​社区日报 第1406期 (2022-05-26)

社区日报Se7en 发表了文章 • 0 个评论 • 1051 次浏览 • 2022-05-26 09:28 • 来自相关话题

1.Elasticsearch Span Query 是什么?
https://lucidworks.com/post/the-spanquery/
2.理解 Elasticsearch Percolate 查询
https://blog.csdn.net/UbuntuTo ... 27651
3. 用 Elasticsearch 造个“知网”难不难?
https://mp.weixin.qq.com/s/tlLaCoi7A0xAM0ZTZw6tyw

编辑:Se7en   
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili