keyword类型的数字的大于小于查询
laoyang360 回复了问题 • 3 人关注 • 3 个回复 • 2881 次浏览 • 2022-05-29 15:02
Elasticsearch:Elastic Maps 现在支持机器学习异常层
liuxg 发表了文章 • 0 个评论 • 1084 次浏览 • 2022-05-26 11:40
Elastic Maps 在 Elastic Cloud 上可用。 你还可以下载 Elastic Stack 和我们的云编排产品 Elastic Cloud Enterprise (ECE) 和 Elastic Cloud for Kubernetes (ECK),以获得自我管理的体验。
在此示例中,我们将使用通用运输饲料规范 (GTFS) 数据。 GTFS 定义了公共交通时刻表和相关地理信息的通用格式。
在下面的展示中,我将使用 Elastic Stack 8.2 来进行展示。
Geographical functions
地理功能检测输入数据的地理位置异常。lat_long 函数检测输入数据的地理位置异常。
注意:你不能为包含地理函数的异常检测作业创建预测。 你也不能将带有条件的规则添加到使用地理函数的检测器中。
该函数支持以下属性:
field_name (required)
by_field_name (optional)
over_field_name (optional)
partition_field_name (optional)
比如,我们在如下的例子中,使用 lat_long 函数来分析信用卡交易的异常:
PUT _ml/anomaly_detectors/example1
{
"analysis_config": {
"detectors": [{
"function" : "lat_long",
"field_name" : "transaction_coordinates",
"by_field_name" : "credit_card_number"
}]
},
"data_description": {
"time_field":"timestamp",
"time_format": "epoch_ms"
}
}
我们知道,在通常的情况下,你的信用卡不可能在一个很小的时间范围里,在美国和中国同时耍卡,除非飞机飞的真的很快很快。如果你在异常检测作业的检测器中使用此 lat_long 函数,它会检测到信用卡交易的地理位置对于特定客户的信用卡而言的异常。 异常可能表明存在欺诈。
重要:你提供的 field_name 必须是一个字符串,其中包含两个逗号分隔的数字,格式为纬度、经度、geo_point 字段、包含点值的 geo_shape 字段或 geo_centroid 聚合。 纬度和经度必须在 -180 到 180 的范围内,并且代表地球表面上的一个点。
比如,JSON 数据可能包含以下交易坐标:
{
"time": 1460464275,
"transaction_coordinates": "40.7,-74.0",
"credit_card_number": "1234123412341234"
}
在 Elasticsearch 中,位置数据很可能存储在 geo_point 字段中。 有关详细信息,请参阅 geo_point 数据类型。 机器学习功能原生支持此数据类型。 具体来说,当从 geo_point 字段中提取数据时,datafeed 将在发送到异常检测作业之前将数据转换为适当的纬度、经度字符串格式。
Elasticsearch:Elastic Maps 现在支持机器学习异常层原文链接:https://blog.csdn.net/UbuntuTo ... 58783
Elasticsearch:如何部署 NLP:文本嵌入和向量搜索
liuxg 发表了文章 • 0 个评论 • 2172 次浏览 • 2022-05-24 10:16
矢量相似性搜索(vector similarity search),或者通常称为语义搜索,超越了传统的基于关键字的搜索,允许用户找到可能没有任何共同关键字的语义相似的文档,从而提供更广泛的结果。向量相似性搜索对密集向量进行操作,并使用 k-最近邻(k-nearest neighbour)搜索来查找相似向量。为此,首先需要使用文本嵌入模型将文本形式的内容转换为其数字向量表示。
我们将使用来自 MS MARCO Passage Ranking Task 的公共数据集进行演示。它由来自 Microsoft Bing 搜索引擎的真实问题和人工生成的答案组成。该数据集是测试向量相似性搜索的完美资源,首先,因为问答是向量搜索最常见的用例之一,其次,MS MARCO 排行榜中的顶级论文以某种形式使用了向量搜索。
在我们的示例中,我们将使用此数据集的样本,使用模型生成文本嵌入,然后对其运行向量搜索。我们还希望对向量搜索产生的结果的质量进行快速验证。在今天的展示中,我将使用 Elastic Stack 8.2 来进行展示。
https://elasticstack.blog.csdn ... 20166
有什么 elasticsearch 轻便的压测方案?
liaosy 回复了问题 • 2 人关注 • 1 个回复 • 1380 次浏览 • 2022-05-23 09:52
如何深入理解ES的分片租约
Charele 回复了问题 • 2 人关注 • 9 个回复 • 1558 次浏览 • 2022-06-02 04:10
设置Watcher,判断两个独立的消息没有同时出现
Jasonspeaking 回复了问题 • 3 人关注 • 3 个回复 • 1184 次浏览 • 2022-05-24 06:05
关于es内存使用的的一些疑问
liujiacheng 回复了问题 • 2 人关注 • 1 个回复 • 1336 次浏览 • 2022-05-21 12:29
关于集合类型多选的问题
duanxiaobiao 回复了问题 • 3 人关注 • 1 个回复 • 1768 次浏览 • 2022-05-18 20:31
多层nested的多条件查询
duanxiaobiao 回复了问题 • 2 人关注 • 1 个回复 • 1876 次浏览 • 2022-05-17 23:19
es 大批量别名引起的性能问题
God_lockin 回复了问题 • 3 人关注 • 2 个回复 • 2021 次浏览 • 2022-05-18 09:34