疲劳是最舒适的枕头,努力工作吧。

Elasticsearch:免费和开放的 Elastic 可观测性入门

在单个的平台上统一日志,指标,应用程序跟踪数据和可用性数据并对其进行上下文处理。Elastic 可观测性提供了整个数字生态系统的运行状况和性能的统一视图。通过预置的收集器来轻松获取数百种数据源的多种数据,Elastic 可观测性可实现可观测性各个面之间的无缝集成。内置的警报功能使你可以查看何时接近 SLA (Service Level Agreement),而专用的应用程序可以使你按照合理的方式解释数据,包括详细的用户体验得分。诸如 Audi,Etsy,Societe Generale,Domain,Kroger 等公司已经为各种用例部署了 Elastic 可观测性,从集中式日志记录到监视数字体验,这些用例范围广泛。

在此博客中,我们将向你展示如何开始使用 Elastic 可观测性。首先,我们将下载并准备软件,然后部署并与 Elastic Stack 的核心 Elasticsearch 进行试运行。接下来,我们将在 Elasticsearch中 启用安全性和基于角色的访问控制,并将窗口 Kibana 连接到 Elastic Stack。Kibana 既用作管理前端又用作可视化层。最后,我们将通过启用 SSL,TLS 和 HTTPS 进一步保护群集。

注意:本博客中的步骤使用运行 Elastic 可观测性 的自我管理选项。这里描述的所有内容都是我们免费和开放的分发层的一部分,具有诸如分布式跟踪,统一代理,数百个数据集成,用于 APM 的精选应用程序,基础结构监视,日志浏览等功能。所有这些功能都可以在 Elastic Cloud上 的 Elasticsearch Service 上使用,这是一个完全托管的服务,并提供免费试用。无论选择哪种方式,你都将获得相同的出色用户体验。

我在 Mac 上运行,但是以下说明应与 Linux 类似。
 
https://elasticstack.blog.csdn ... 98566
 
继续阅读 »
在单个的平台上统一日志,指标,应用程序跟踪数据和可用性数据并对其进行上下文处理。Elastic 可观测性提供了整个数字生态系统的运行状况和性能的统一视图。通过预置的收集器来轻松获取数百种数据源的多种数据,Elastic 可观测性可实现可观测性各个面之间的无缝集成。内置的警报功能使你可以查看何时接近 SLA (Service Level Agreement),而专用的应用程序可以使你按照合理的方式解释数据,包括详细的用户体验得分。诸如 Audi,Etsy,Societe Generale,Domain,Kroger 等公司已经为各种用例部署了 Elastic 可观测性,从集中式日志记录到监视数字体验,这些用例范围广泛。

在此博客中,我们将向你展示如何开始使用 Elastic 可观测性。首先,我们将下载并准备软件,然后部署并与 Elastic Stack 的核心 Elasticsearch 进行试运行。接下来,我们将在 Elasticsearch中 启用安全性和基于角色的访问控制,并将窗口 Kibana 连接到 Elastic Stack。Kibana 既用作管理前端又用作可视化层。最后,我们将通过启用 SSL,TLS 和 HTTPS 进一步保护群集。

注意:本博客中的步骤使用运行 Elastic 可观测性 的自我管理选项。这里描述的所有内容都是我们免费和开放的分发层的一部分,具有诸如分布式跟踪,统一代理,数百个数据集成,用于 APM 的精选应用程序,基础结构监视,日志浏览等功能。所有这些功能都可以在 Elastic Cloud上 的 Elasticsearch Service 上使用,这是一个完全托管的服务,并提供免费试用。无论选择哪种方式,你都将获得相同的出色用户体验。

我在 Mac 上运行,但是以下说明应与 Linux 类似。
 
https://elasticstack.blog.csdn ... 98566
  收起阅读 »

社区日报 第1240期 (2021-04-19)

1.使用elasticdump 工具完成对elasticsearch数据的到处
https://www.cnblogs.com/zhujiqian/p/14641972.html
2.使用es搭配doris完善OLAP查询
http://doris.apache.org/master ... .html
3.Laravel中使用ElasticSearch
http://blog.bigfoot.xin/post/5.html

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.使用elasticdump 工具完成对elasticsearch数据的到处
https://www.cnblogs.com/zhujiqian/p/14641972.html
2.使用es搭配doris完善OLAP查询
http://doris.apache.org/master ... .html
3.Laravel中使用ElasticSearch
http://blog.bigfoot.xin/post/5.html

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1237期 (2021-04-16)

1、SQLServer 连接Elasticsearch 的两种方式
https://hevodata.com/learn/ela ... rver/
 
2、如何制作 GeoJSON 文件并进行地理位置搜索?
https://elasticstack.blog.csdn ... 27243
 
3、Elasticsearch+kibana集成实例
https://blog.galenhealthcare.c ... tion/
 
 

编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

继续阅读 »
1、SQLServer 连接Elasticsearch 的两种方式
https://hevodata.com/learn/ela ... rver/
 
2、如何制作 GeoJSON 文件并进行地理位置搜索?
https://elasticstack.blog.csdn ... 27243
 
3、Elasticsearch+kibana集成实例
https://blog.galenhealthcare.c ... tion/
 
 

编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

收起阅读 »

社区日报 第1236期 (2021-04-15)

1.elastic apm入选gartner
https://www.elastic.co/blog/el ... oring
2.Kibana:运用 script fields 对数据进行清洗
https://elasticstack.blog.csdn ... 15431
3.基于 ELK 天气指标监控在线实时监控案例
https://blog.csdn.net/u0142965 ... 29424

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.elastic apm入选gartner
https://www.elastic.co/blog/el ... oring
2.Kibana:运用 script fields 对数据进行清洗
https://elasticstack.blog.csdn ... 15431
3.基于 ELK 天气指标监控在线实时监控案例
https://blog.csdn.net/u0142965 ... 29424

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

Elasticsearch:Script fields 及其调试

在搜索时,每个 _search 请求的匹配(hit)可以使用 script_fields (基于不同的字段)定制一些属性。这些定制的属性(script fields)通常是:

针对原有值的修改(比如,价钱的转换,不同的排序方法等)
一个崭新的及算出来的属性(比如,总和,加权,指数运算,距离测量等)

原文链接:https://blog.csdn.net/UbuntuTo ... 92778
继续阅读 »
在搜索时,每个 _search 请求的匹配(hit)可以使用 script_fields (基于不同的字段)定制一些属性。这些定制的属性(script fields)通常是:

针对原有值的修改(比如,价钱的转换,不同的排序方法等)
一个崭新的及算出来的属性(比如,总和,加权,指数运算,距离测量等)

原文链接:https://blog.csdn.net/UbuntuTo ... 92778 收起阅读 »

如何使用 Elasticsearch 和 Python 构建面部识别系统

你是否曾经尝试在图像中搜索对象? Elasticsearch 可以帮助你存储,分析和搜索图像或视频中的对象。

在本快速教程中,我们将向你展示如何构建一个使用 Python 进行面部识别的系统。 了解有关如何检测和编码面部信息的更多信息-并在搜索中找到匹配项。



在今天的练习中,我们将参照代码:https://github.com/liu-xiao-gu ... earch。你可以把这个代码下载到本地的电脑:

原文链接:https://blog.csdn.net/UbuntuTo ... 27926
继续阅读 »
你是否曾经尝试在图像中搜索对象? Elasticsearch 可以帮助你存储,分析和搜索图像或视频中的对象。

在本快速教程中,我们将向你展示如何构建一个使用 Python 进行面部识别的系统。 了解有关如何检测和编码面部信息的更多信息-并在搜索中找到匹配项。



在今天的练习中,我们将参照代码:https://github.com/liu-xiao-gu ... earch。你可以把这个代码下载到本地的电脑:

原文链接:https://blog.csdn.net/UbuntuTo ... 27926 收起阅读 »

社区日报 第1235期 (2021-04-12)

1. 关于elasticsearch 的6件不太明显的事情
https://blog.csdn.net/weixin_4 ... 44331

2.从诗词大会飞花令到elasticsearch原理解析
https://mp.weixin.qq.com/s/LD2VG6dRNYXOO9KE38F_Mg

3.温故而知新,来了解下elasticsearch 的发展史吧(截止7.0)
https://www.cnblogs.com/wangzh ... .html

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1. 关于elasticsearch 的6件不太明显的事情
https://blog.csdn.net/weixin_4 ... 44331

2.从诗词大会飞花令到elasticsearch原理解析
https://mp.weixin.qq.com/s/LD2VG6dRNYXOO9KE38F_Mg

3.温故而知新,来了解下elasticsearch 的发展史吧(截止7.0)
https://www.cnblogs.com/wangzh ... .html

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1234期 (2021-4-11)

1.(自备梯子)Lyft的Elasticsearch优化。 
https://eng.lyft.com/elasticse ... 20932 
2.如何为生产建立Elastic搜索集群? 
https://www.cncf.io/blog/2021/ ... tion/ 
3.我如何将GTA Online的加载时间减少70%。 
https://nee.lv/2021/02/28/How- ... y-70/

编辑:至尊宝
归档:https://ela.st/cn-daily-all 
订阅:https://ela.st/cn-daily-sub 
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.(自备梯子)Lyft的Elasticsearch优化。 
https://eng.lyft.com/elasticse ... 20932 
2.如何为生产建立Elastic搜索集群? 
https://www.cncf.io/blog/2021/ ... tion/ 
3.我如何将GTA Online的加载时间减少70%。 
https://nee.lv/2021/02/28/How- ... y-70/

编辑:至尊宝
归档:https://ela.st/cn-daily-all 
订阅:https://ela.st/cn-daily-sub 
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1232期 (2021-04-09)

1、Elasticsearch 和 Kafka 强强联合、无缝衔接
https://www.elastic.co/cn/blog ... ience
2、基于EFK的日志场景实践
https://blog.dream11engineerin ... 13cd5
3、Kibana 部署视频详解(梯子)
https://www.youtube.com/watch?v=kqCd2mVQE54
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1、Elasticsearch 和 Kafka 强强联合、无缝衔接
https://www.elastic.co/cn/blog ... ience
2、基于EFK的日志场景实践
https://blog.dream11engineerin ... 13cd5
3、Kibana 部署视频详解(梯子)
https://www.youtube.com/watch?v=kqCd2mVQE54
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1231期 (2021-04-08)

1. 如何使用 Elastic 可观测性来监测 NVIDIA GPU 指标
https://www.elastic.co/cn/blog ... ility
2.设置Elasticsearch集群(梯子)
https://medium.com/grafana-tut ... 16cb4
3.集中式日志 EFK — Helm (Elasticsearch, Fluentd, Kibana)(梯子)
https://rajprataprps.medium.co ... d79f2

编辑:寂寞的烟
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
 
继续阅读 »
1. 如何使用 Elastic 可观测性来监测 NVIDIA GPU 指标
https://www.elastic.co/cn/blog ... ility
2.设置Elasticsearch集群(梯子)
https://medium.com/grafana-tut ... 16cb4
3.集中式日志 EFK — Helm (Elasticsearch, Fluentd, Kibana)(梯子)
https://rajprataprps.medium.co ... d79f2

编辑:寂寞的烟
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
  收起阅读 »

Elasticsearch 实现模糊查询效果方式对比


下面是ES做传统意义上的模糊查询的两种方式,我们分析下优劣势
1:将字段设置为keyword类型,使用wildcard实现模糊查询,如果数据量较大,这种方式模糊查询效率是非常低的,所以实际案例中其实是不太实用的,除非你的数据量只有几十万,完全不用考虑效率问题,而且ES限制单个词条不能超过32766个字节,那么超过10000多字符的文章是不能被全部索引到的,那么模糊查询时就查不到没有索引到的关键词。

2:实用match_phrase查询,设置slop为0,配合单字分词实现模糊查询效果。
第二种方式最关键的是我们要实现单字符的分词,通常很多人认为标准分词器就是单字分词,事实上stander分词器只能对中文实现单字分词,对英文与数字是不能单字符分词的,而且本身就是忽略标点符号的,这样的话用match_phrase实现模糊查询其实就有误差了,例如 “中国最美,丽江盛景”,这个时候我们搜索“美丽”也一样能搜到,因为他本身忽略了标点符号,或者搜索数字或者字母时也一样没有办法跟传统的模糊查询保持一致。

所以经过测试,推荐使用ngram自定义配置实现单字分词效果,分析器配置入下
"analysis": {
"analyzer": {
"charSplit": {
"type": "custom",
"tokenizer": "my_ngram_tokenizer",
"filter": [
"lowercase"
],
"char_filter": [
"html_strip"
]
}
},
"tokenizer": {
"my_ngram_tokenizer": {
"type": "nGram",
"min_gram": "1",
"max_gram": "1",
"token_chars": [
"letter",
"digit",
"punctuation"
]
}
}
}
这样我们可以把所有的字符都单字分词,然后配合match_phrase就能实现一个真正意义上的模糊查询,这种搜索效率是比wildcard要高出很多。

上面两种方式都可以实现模糊查询的效果,第一种方式缺点就是效率太低,而且字段长度太大没有办法全部索引到。再看下第二种方式的问题

1.使用ngram单字分词会导致索引量增加(测试发现基本会翻倍甚至更多),相应的分片数与硬件配置要求需要增加。

2.使用单字符分词会使同义词查询失效,甚至影响相似性查询等操作,当然,一般来说要模糊查询也就不会考虑同义词查询了。

3.继承了传统模糊查询的问题,如搜索“8年抗战”相关内容,直接搜索关键词“8年”,会搜索到包含“2018年”的内容,这样显然不是你要的结果,但是模糊查询就是这样的效果。

4.field_data也是基于倒排索引实现功能,如有聚合或者排序等操作,也会使用单字符效果,如:某字段存储汉字“中国”,“美国”,但类型为text,这个时候如果要按照国家来聚合查询数据,单字段分词结果就会不准确,就是说聚合与排序也会用单字分词后的索引去做聚合与排序,结果自然也就有偏差了.

以上就是两种模糊查询的方式对比,实际环境里还是需要按照实际的需求与环境决定怎样选择,各位大神如果有更好的方式欢迎交流分享!

继续阅读 »

下面是ES做传统意义上的模糊查询的两种方式,我们分析下优劣势
1:将字段设置为keyword类型,使用wildcard实现模糊查询,如果数据量较大,这种方式模糊查询效率是非常低的,所以实际案例中其实是不太实用的,除非你的数据量只有几十万,完全不用考虑效率问题,而且ES限制单个词条不能超过32766个字节,那么超过10000多字符的文章是不能被全部索引到的,那么模糊查询时就查不到没有索引到的关键词。

2:实用match_phrase查询,设置slop为0,配合单字分词实现模糊查询效果。
第二种方式最关键的是我们要实现单字符的分词,通常很多人认为标准分词器就是单字分词,事实上stander分词器只能对中文实现单字分词,对英文与数字是不能单字符分词的,而且本身就是忽略标点符号的,这样的话用match_phrase实现模糊查询其实就有误差了,例如 “中国最美,丽江盛景”,这个时候我们搜索“美丽”也一样能搜到,因为他本身忽略了标点符号,或者搜索数字或者字母时也一样没有办法跟传统的模糊查询保持一致。

所以经过测试,推荐使用ngram自定义配置实现单字分词效果,分析器配置入下
"analysis": {
"analyzer": {
"charSplit": {
"type": "custom",
"tokenizer": "my_ngram_tokenizer",
"filter": [
"lowercase"
],
"char_filter": [
"html_strip"
]
}
},
"tokenizer": {
"my_ngram_tokenizer": {
"type": "nGram",
"min_gram": "1",
"max_gram": "1",
"token_chars": [
"letter",
"digit",
"punctuation"
]
}
}
}
这样我们可以把所有的字符都单字分词,然后配合match_phrase就能实现一个真正意义上的模糊查询,这种搜索效率是比wildcard要高出很多。

上面两种方式都可以实现模糊查询的效果,第一种方式缺点就是效率太低,而且字段长度太大没有办法全部索引到。再看下第二种方式的问题

1.使用ngram单字分词会导致索引量增加(测试发现基本会翻倍甚至更多),相应的分片数与硬件配置要求需要增加。

2.使用单字符分词会使同义词查询失效,甚至影响相似性查询等操作,当然,一般来说要模糊查询也就不会考虑同义词查询了。

3.继承了传统模糊查询的问题,如搜索“8年抗战”相关内容,直接搜索关键词“8年”,会搜索到包含“2018年”的内容,这样显然不是你要的结果,但是模糊查询就是这样的效果。

4.field_data也是基于倒排索引实现功能,如有聚合或者排序等操作,也会使用单字符效果,如:某字段存储汉字“中国”,“美国”,但类型为text,这个时候如果要按照国家来聚合查询数据,单字段分词结果就会不准确,就是说聚合与排序也会用单字分词后的索引去做聚合与排序,结果自然也就有偏差了.

以上就是两种模糊查询的方式对比,实际环境里还是需要按照实际的需求与环境决定怎样选择,各位大神如果有更好的方式欢迎交流分享!

收起阅读 »