如同磁铁吸引四周的铁粉,热情也能吸引周围的人,改变周围的情况。

社区日报 第1688期 (2023-08-21)

社区日报yuebancanghai 发表了文章 • 0 个评论 • 1447 次浏览 • 2023-08-21 19:38 • 来自相关话题

1. ElasticSearch高级篇(数据聚和、自动补全、数据同步、分片集群)
   https://blog.csdn.net/fengxian ... 15858
2. ElasticSearch分片不均匀,集群负载不均衡
   https://blog.csdn.net/qq_20545 ... 49335
3. 如何用 Elasticsearch 实现“图搜图”
   https://mp.weixin.qq.com/s/PgY035gC_BfU-AG4cO6NtQ
编辑:yuebancanghai
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

这个是不是多余的代码

回复

ElasticsearchCharele 发起了问题 • 1 人关注 • 0 个回复 • 3311 次浏览 • 2023-08-19 13:10 • 来自相关话题

社区日报 第1687期 (2023-08-18)

社区日报laoyang360 发表了文章 • 0 个评论 • 1440 次浏览 • 2023-08-18 22:18 • 来自相关话题


1、Elasticsearch  ESQL解读
https://www.elastic.co/cn/blog ... -esql

2、Elasticsearch vs OpenSearch 对比视频解读
https://www.elastic.co/cn/blog ... e-gap

3、Elasticsearch 预先加载数据的多种方案
https://www.elastic.co/cn/blog ... taset

编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili

请教一个关于关注列表用户搜索的场景问题

Elasticsearchzcc_vv 回复了问题 • 2 人关注 • 1 个回复 • 1790 次浏览 • 2023-08-18 18:53 • 来自相关话题

elasticsearch 缺乏足够的无分段虚拟地址空间,导致集群故障,请问有什么优化方案吗

ElasticsearchFFFrp 回复了问题 • 3 人关注 • 2 个回复 • 2954 次浏览 • 2023-08-25 10:48 • 来自相关话题

比FST还要快的东东?

回复

ElasticsearchCharele 发起了问题 • 1 人关注 • 0 个回复 • 2429 次浏览 • 2023-08-17 14:05 • 来自相关话题

社区日报 第1686期 (2023-08-17)

社区日报Se7en 发表了文章 • 0 个评论 • 1637 次浏览 • 2023-08-17 09:15 • 来自相关话题

1.如何在 ElasticSearch 结合过滤与向量搜索(需要梯子)
https://medium.com/%40fatihsat ... 8d179
2.Elasticsearch 通过路由提升聚合性能(需要梯子)
https://medium.com/%40kulekci/ ... 1e12d
3.优化 Elasticsearch 以实现大容量数据摄取(需要梯子)
https://medium.com/%40yannvds/ ... ee574

编辑:Se7en
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili

使用 Logstash 同步 MySQL 到 Easysearch

Easysearchyangmf2040 发表了文章 • 0 个评论 • 2289 次浏览 • 2023-08-17 00:49 • 来自相关话题

从 MySQL 同步数据到 ES 有多种方案,这次我们使用 ELK 技术栈中的 Logstash 来将数据从 MySQL 同步到 Easysearch 。

方案前提


  1. MySQL 表记录必须有主键,比如 id 字段。通过该字段,可将 Easysearch 索引数据与 MySQL 表数据形成一对一映射关系,支持修改。
  2. MySQL 表记录必须有时间字段,以支持增量同步。

    如果上述条件具备,便可使用 logstash 定期同步新写入或修改后的数据到 Easysearch 中。

    方案演示

    版本信息

    MySQL: 5.7
    Logstash: 7.10.2
    Easysearch: 1.5.0

    MySQL 设置

    创建演示用的表。
    yaml<br /> CREATE DATABASE es_db;<br /> USE es_db;<br /> DROP TABLE IF EXISTS es_table;<br /> CREATE TABLE es_table (<br /> id BIGINT(20) UNSIGNED NOT NULL,<br /> PRIMARY KEY (id),<br /> UNIQUE KEY unique_id (id),<br /> client_name VARCHAR(32) NOT NULL,<br /> modification_time TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,<br /> insertion_time TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP<br /> );<br />
    说明

    • id 字段: 主键、唯一键,将作为 Easysearch 索引中的 doc id 字段。
    • modification_time 字段: 表记录的插入和修改都会记录在此。
    • client_name: 代表用户数据。
    • insertion_time: 可省略,用来记录数据插入到 MySQL 数据的时间。

      插入数据

      yaml<br /> INSERT INTO es_table (id, client_name) VALUES (1, 'test 1');<br /> INSERT INTO es_table (id, client_name) VALUES (2, 'test 2');<br /> INSERT INTO es_table (id, client_name) VALUES (3, 'test 3');<br />

      Logstash

      配置文件
      yaml<br /> input {<br /> jdbc {<br /> jdbc_driver_library => "./mysql-connector-j-8.1.0/mysql-connector-j-8.1.0.jar"<br /> jdbc_driver_class => "com.mysql.jdbc.Driver"<br /> jdbc_connection_string => "jdbc:mysql://192.168.56.3:3306/es_db"<br /> jdbc_user => "root"<br /> jdbc_password => "password"<br /> jdbc_paging_enabled => true<br /> tracking_column => "unix_ts_in_secs"<br /> use_column_value => true<br /> tracking_column_type => "numeric"<br /> last_run_metadata_path => "./.mysql-es_table-sql_last_value.yml"<br /> schedule => "*/5 * * * * *"<br /> statement => "SELECT *, UNIX_TIMESTAMP(modification_time) AS unix_ts_in_secs FROM es_table WHERE (UNIX_TIMESTAMP(modification_time) > :sql_last_value AND modification_time < NOW()) ORDER BY modification_time ASC"<br /> }<br /> jdbc {<br /> jdbc_driver_library => "./mysql-connector-j-8.1.0/mysql-connector-j-8.1.0.jar"<br /> jdbc_driver_class => "com.mysql.jdbc.Driver"<br /> jdbc_connection_string => "jdbc:mysql://192.168.56.3:3306/es_db"<br /> jdbc_user => "root"<br /> jdbc_password => "password"<br /> schedule => "*/5 * * * * *"<br /> statement => "SELECT count(*) AS count,'es_table' AS table_name from es_table"<br /> }<br /> }<br /> filter {<br /> if ![table_name] {<br /> mutate {<br /> copy => { "id" => "[@metadata][_id]"}<br /> remove_field => ["@version", "unix_ts_in_secs","@timestamp"]<br /> add_field => { "[@metadata][target_index]" => "mysql_es_table" } }<br /> } else {<br /> mutate { <br /> add_field => { "[@metadata][target_index]" => "table_counts" } <br /> remove_field => ["@version"]<br /> }<br /> uuid {<br /> target => "[@metadata][_id]"<br /> overwrite => true<br /> }<br /> }<br /> }<br /> output {<br /> elasticsearch {<br /> hosts => ["<a href="https://localhost:9200"" rel="nofollow" target="_blank">https://localhost:9200"</a>]<br /> user => "admin"<br /> password => "f0c6fc61fe5f7b084c00"<br /> ssl_certificate_verification => "false"<br /> index => "%{[@metadata][target_index]}"<br /> manage_template => "false"<br /> document_id => "%{[@metadata][_id]}"<br /> }<br /> }<br />

    • 每 5 秒钟同步一次 es_table 表的数据到 mysql_sync_idx 索引。
    • 每 5 秒统计一次 es_table 表的记录条数到 table_counts 索引,用于监控。

      启动 logstash

      yaml<br /> ./bin/logstash -f sync_es_table.conf<br />
      查看同步结果, 3 条数据都已同步到索引。
      ![](https://www.infinilabs.com/img ... /1.png)
      Mysql 数据库新增记录
      yaml<br /> INSERT INTO es_table (id, client_name) VALUES (4, 'test 4');<br />
      Easysearch 确认新增
      ![](https://www.infinilabs.com/img ... /2.png)

      Mysql 数据库修改记录
      yaml<br /> UPDATE es_table SET client_name = 'test 0001' WHERE id=1;<br />
      Easysearch 确认修改
      ![](https://www.infinilabs.com/img ... /3.png)

      删除数据

      Logstash 无法直接删除操作到 ES ,有两个方案:

  3. 在表中增加 is_deleted 字段,实现软删除,可达到同步的目的。查询过滤掉 is_deleted : true 的记录,后续通过脚本等方式定期清理 is_deleted : true 的数据。
  4. 执行删除操作的程序,删除完 MySQL 中的记录后,继续删除 Easysearch 中的记录。

    同步监控

    数据已经在 ES 中了,我们可利用 INFINI Console 的数据看板来监控数据是否同步,展示表记录数、索引记录数及其变化。
    ![](https://www.infinilabs.com/img ... /4.png)

TieredMergePolicy中的为什么当hitTooLarge为true时,skew设为最优值

LuceneCharele 回复了问题 • 2 人关注 • 1 个回复 • 2373 次浏览 • 2023-08-16 23:34 • 来自相关话题

社区日报 第1685期 (2023-08-16)

社区日报kin122 发表了文章 • 0 个评论 • 1368 次浏览 • 2023-08-16 16:06 • 来自相关话题

1.ES的文档关联度算法解析(需要梯子)
https://medium.com/%40_niteshs ... 74004
2.‘Cycle detected for pipeline: main-pipeline’报错探究(需要梯子)
https://medium.com/%40musabdog ... f993d
3.搜文本搜位置搜图片,1小时玩转阿里云 Elasticsearch
https://blog.csdn.net/UbuntuTo ... 89544

编辑:kin122
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

fuzziness AUTO参数疑问

ElasticsearchCharele 回复了问题 • 2 人关注 • 1 个回复 • 1524 次浏览 • 2023-08-16 16:16 • 来自相关话题

社区日报 第1684期 (2023-08-15)

社区日报God_lockin 发表了文章 • 0 个评论 • 1242 次浏览 • 2023-08-15 14:15 • 来自相关话题



1. python接入ES利器之又一个 Django(需要梯子)
https://awstip.com/mastering-e ... a861a

2. 在Admina,我们这样存数据(需要梯子)
https://mfi.engineering/how-do ... 37551

3. 同一网络里的俩节点,咋用ES agent采日志?(需要梯子)
https://medium.com/%40bytaskin ... e9194

编辑:斯蒂文
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili

elastic快照备份到minio频繁出现超时

ElasticsearchCharele 回复了问题 • 3 人关注 • 3 个回复 • 2218 次浏览 • 2023-08-23 10:52 • 来自相关话题

社区日报 第1683期 (2023-08-14)

社区日报yuebancanghai 发表了文章 • 0 个评论 • 1268 次浏览 • 2023-08-14 13:31 • 来自相关话题

1. 推出 Elasticsearch 查询语言 (ES|QL)
  https://elasticstack.blog.csdn ... .5502
2. 使用 Elasticsearch 进行地理位置搜索
   https://zhuanlan.zhihu.com/p/315931530
3. 如何让主分片(shards)均匀分布
   https://blog.csdn.net/myhes/ar ... 22966
编辑:yuebancanghai
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站:https://ela.st/bilibili

社区日报 第1682期 (2023-08-11)

社区日报laoyang360 发表了文章 • 0 个评论 • 2146 次浏览 • 2023-08-11 13:09 • 来自相关话题

1、实时数据处理:Storm、Kafka与ElasticSearch的应用
https://www.javacodegeeks.com/ ... .html

2、Elasticsearch vs OpenSearch,如何选型?性能对比告诉你答案
https://www.elastic.co/cn/blog ... e-gap

3、在Elasticsearch搜索结果中提升最近活动的权重实现(梯子)
https://medium.com/%40abhishek ... 63cf4

4、Elasticsearch 成本优化实战
https://search-guard.com/elast ... tion/

编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
B站: https://ela.st/bilibili