不要急,总有办法的

社区日报 第1516期 (2022-10-20)

社区日报Se7en 发表了文章 • 0 个评论 • 1431 次浏览 • 2022-10-20 12:24 • 来自相关话题

1.Elasticsearch Stateless 架构介绍
https://www.elastic.co/cn/blog ... earch
2.使用 Elastic Stack 监控 Kubernetes 集群(需要梯子)
https://medium.com/nerd-for-te ... a3e7c
3.使用 Elastic Stack 监控 ETL 管道(需要梯子)
https://medium.com/quantyca/mo ... 8e6d1

编辑:Se7en
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili

社区日报 第1515期 (2022-10-19)

社区日报kin122 发表了文章 • 0 个评论 • 1318 次浏览 • 2022-10-19 18:02 • 来自相关话题

1.ES6.x默认store为mmapfs(Linux 64位),mmap性能相关分析
https://blog.csdn.net/qq_33999 ... 04291
2.记一次Elasticsearch OOM(内存溢出)的优化过程—基于segments force merge 和 store type 转为 hybridfs
https://cloud.tencent.com/deve ... 10170
3.Logstash: Grok 模式示例
https://elasticstack.blog.csdn ... 37670

编辑:kin122
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

ES 如何针对数组类型字段结果进行分页

ElasticsearchCharele 回复了问题 • 2 人关注 • 1 个回复 • 1592 次浏览 • 2022-10-19 11:30 • 来自相关话题

infini console 中看不到索引和查询吞吐信息

默认分类liugq 回复了问题 • 2 人关注 • 1 个回复 • 1747 次浏览 • 2022-10-18 18:06 • 来自相关话题

社区日报 第1514期 (2022-10-18)

社区日报God_lockin 发表了文章 • 0 个评论 • 1466 次浏览 • 2022-10-18 09:09 • 来自相关话题

1. 没想到吧,ES还能拿来监控KPI(需要梯子)
https://medium.com/%40stavsofe ... 7bbdf
2. 从 EQL 到 VQL(需要梯子)
https://velociraptor.velocidex ... 40624
3. ES的冻结层(Frozen tier)还有人不懂嘛?(需要梯子)
https://joshua-robinson.medium ... 9dfc4
编辑:斯蒂文
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili
 

社区日报 第1513期 (2022-10-17)

社区日报yuebancanghai 发表了文章 • 0 个评论 • 1387 次浏览 • 2022-10-17 19:51 • 来自相关话题

1. 携程搜索基于 CNN 的新词发现算法
   https://www.6aiq.com/article/1665662220461

2. kibana如何制作出好看酷炫的图表
   https://zhuanlan.zhihu.com/p/86703607

3. 百亿级实时计算系统性能优化–—Elasticsearch篇
   https://zhuanlan.zhihu.com/p/3 ... ao.io

编辑:yuebancanghai
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

cancellable : true 的task 都无法cancel

默认分类locatelli 回复了问题 • 4 人关注 • 3 个回复 • 2133 次浏览 • 2022-10-26 10:37 • 来自相关话题

社区日报 第1512期 (2022-10-13)

社区日报Se7en 发表了文章 • 0 个评论 • 1517 次浏览 • 2022-10-13 20:05 • 来自相关话题

1.Elasticsearch杀手神器,让es操作更简单
https://mp.weixin.qq.com/s/oFHPhUzoittNyhIOJ8dm0Q
2.Elasticsearch LDAP 认证(需要梯子)
https://medium.com/%40surangaj ... fcdbf
3.使用 Elasticsearch 预测数据(需要梯子)
https://medium.com/%40surangaj ... 82a1a

编辑:Se7en   
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili

elasticsearch角色分离之后,master节点作为协调节点被打挂

ElasticsearchCharele 回复了问题 • 3 人关注 • 2 个回复 • 2404 次浏览 • 2022-10-16 19:54 • 来自相关话题

社区日报 第1511期 (2022-10-12)

社区日报kin122 发表了文章 • 0 个评论 • 1231 次浏览 • 2022-10-13 11:47 • 来自相关话题

1.Elasticsearch:运用 Pinned query 来提升特定的结果
https://blog.csdn.net/UbuntuTo ... 45555

2.Elasticsearch DSL 语法中 queries/filters 执行顺序探秘
https://www.6aiq.com/article/1597589414980

3.Elasticsearch常见的报错处理#yyds干货盘点#
https://blog.51cto.com/liqingbiao/4918018



编辑:kin122
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

关于ES分片中的拷贝物理文件

回复

ElasticsearchCharele 回复了问题 • 2 人关注 • 5 个回复 • 2515 次浏览 • 2022-10-24 13:10 • 来自相关话题

社区日报 第1510期 (2022-10-11)

社区日报God_lockin 发表了文章 • 0 个评论 • 1384 次浏览 • 2022-10-11 09:59 • 来自相关话题


1. 在k8s上搭企业级ELKB(需要梯子)
https://medium.com/%40siddhart ... 677bb
2. Es8 新功能,NER(需要梯子)
https://medium.com/%40psajan10 ... 6c5e8
3. 还在这样对待ES,他要哭了(需要梯子)
https://medium.com/trendyol-te ... 85746
编辑:斯蒂文
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili
 

社区日报 第1509期 (2022-10-10)

社区日报yuebancanghai 发表了文章 • 0 个评论 • 1304 次浏览 • 2022-10-10 23:24 • 来自相关话题

1. 知识图谱在美团搜索酒旅场景认知中的应用
   https://www.6aiq.com/article/1664520291651

2. 详解闲鱼搜索系统
   https://www.6aiq.com/article/1664281210765

3. 探究 | kafka-connector 同步 Elasticsearch速度慢根因分析
   https://blog.csdn.net/laoyang3 ... 50717

编辑:yuebancanghai
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

es2.4.1 单节点,java客户端持续提交数据时断断续续的报NoNodeAvailableException

回复

Elasticsearchlvwendong 发起了问题 • 1 人关注 • 0 个回复 • 2453 次浏览 • 2022-10-10 11:20 • 来自相关话题

ES7.5升级7.17后在写多读少场景下CPU、IO飙升

Elasticsearchzmc 发表了文章 • 0 个评论 • 2885 次浏览 • 2022-10-09 19:37 • 来自相关话题

背景


1.ES PAAS管理的集群升级了100+,从7.5升级到7.17 (保证每个大版本最终仅维护一个小版本集群)

2.由于业务使用差异大,也出了不少问题,前面的文章也有提到过Integer类型字段使用terms查询效率低的情况

3.这里再分析一个CPU、IO飙升的场景

现象


1.用户报障:“ES集群写入吞吐量变小了”

2.观察下来发现确实CPU高了,IO也有明显抖动

1.png



2.png



排查与分析


1.发现YoungGC频率变高了一些,猜测可能是G1GC的问题(我们使用JDK11重新打了ES镜像),经过版本替换,没有明显变化。

参考issue:https://github.com/elastic/ela ... 46169

这可能是另一个场景的case,经过测试,不属于我们的场景。

2.多次执行hot_threads API观察, 发现时不时会出现 update相关函数 消耗的 CPU多。

3.继续使用arthas抓取一段时间的数据,发现是 FST、DocID 读取慢

3.png



从图中可以看到Bulk请求执行过程中的getDocID方法占有大量CPU。

4.集群写多读少,使用的是niofs。可知,7.5版本的FST是在堆外,但是_id字段是在堆内。升级到7.17版本后,FST在堆外,该字段也放到了堆外(官方版本应该是7.9就开始放到堆外了)。数据放到堆外,其实也就是文件放到磁盘,读一次之后放到pagecache。

这样也就可以解释了,在upsert类请求多的时候会频繁查询docId,此时如果_id字段没有进入pageCache或者被踢出pageCache,那么就会出现响应慢,并且CPU高、IO高的情况。

5.mmapfs、hybridfs实测是什么情况暂时不明确,目前没有收到搜索类集群CPU、IO方面的报障。


测试验证


将FST、BKD等全部改成放到堆内(开源版需要改造)

4.png



可以看到,CPU有显著下降,也相对均衡。(之前蓝色线高,是因为该节点有大量的主分片)

结论


1.update、upsert、get等请求如果十分频繁,_id使用offheap将不会是个好的选择,除非给足够的堆外内存,并且保证尽可能常驻内存。

2.不同的业务场景下使用ES的同一版本也会有不一样的效果。

3.mmapfs、hybridfs在频繁update情况下,实测是什么情况暂时不明确,目前没有收到搜索类集群CPU、IO方面的报障,可能不会有这么明显的差距。(官方描述写入速度仅降低了1.8%)

4.最后吐槽一下,写入不停的情况下,translog的恢复实在是太慢了,由于大分片恢复/rebalance时,translog不会被清理,导致恢复/迁移速度急剧下降...目前各个版本也没什么好的解决方式。