elasticsearch主分片向副分片同步文件时,为什么不用zerocopy模式,而是要read到es,再write?
Charele 回复了问题 • 6 人关注 • 5 个回复 • 3625 次浏览 • 2022-06-20 19:53
ES数据备份和清理-快照
ziyou 发表了文章 • 3 个评论 • 17163 次浏览 • 2018-04-04 17:41
看大家好多是主要考虑数据的安全性才做的数据的备份,我们就比较low了,我们就是因硬盘不够,要删数据。上个项目是因为日志数据重要程度一般般,就保留了一个月的量,然后也没有做数据的备份转储。这次上线的项目要求就高点了,需要删除的数据存储到其他地方,但是硬盘的容量更低了。所以就需要做ES数据备份和转储,转储完了就清掉。
这里是用ES官方推荐的数据快照方案,这个方案可以完全通过ES API进行操作,比价方便、快捷,在数据恢复方面也是方便的。
先上ES官方的链接,大家看看:https://www.elastic.co/guide/e ... .html
然后就是步骤了:
执行过程分为两部分:
一、准备过程
1、添加ES备份存储目录
在集群的每台机器上进行目录创建
mkdir /home/esdata
2、挂载共享文件存储目录
在集群的每台机器上目录挂载
mount -t nfs 10.70.61.80:/home/apmtest /home/esdata
3、修改ES集群配置
在ES集群的每台机器上都添加path.repo属性
path.repo: ["/home/esdata"]
4、重启ES集群
ES集群重启必须是关闭所有机器后,再启动。
5、建立备份仓库
PUT /_snapshot/my_backup
{
"type": "fs",
"settings": {
"location": "/home/esdata"
}
}
二、备份数据快照
1、通过API执行备份
PUT /_snapshot/my_backup/snapshot_2018.03.01?wait_for_completion=true
{
"indices": "filebeat-2018.03.01"
}
快照仓库需要注意的地方就是需要在整个集群的每一台机器上挂载相同的共享文件存储目录,保证在集群里做的操作是输出到相同的地方的。
下面来一份shell脚本,可以定时执行,是做ES数据的定时转储和清理的,大家可以借鉴一下
#!/bin/bash
ESIP=127.0.0.1
DATE=`date -d '-2 days' +'%Y.%m.%d'`
INDEX='{ "indices": "'$DATE'" }'
echo "begin to backup ES LOG..."
curl -XPUT "http://$ESIP:9200/_snapshot/my_backup/snapshot_$DATE?wait_for_completion=true" -d $INDEX
echo "----------------------------------------------------------------------------"
echo "begin to clean ES LOG..."
URL1="http://$ESIP:9200/filebeat-$DATE"
curl -XDELETE $URL1
echo "TRANSFER AND CLEAN ES LOG END!" es 建立父子关系的mapping 的时候, 这个mapping 是建立在子的 mapping 上, 还是独立于 父和子的mapping 再独立建立第三个 mapping?
laoyang360 回复了问题 • 3 人关注 • 1 个回复 • 3776 次浏览 • 2018-04-04 18:30
mapping中这个是什么意思?
sweetpotato 回复了问题 • 3 人关注 • 3 个回复 • 7039 次浏览 • 2018-04-08 11:11
ES多字段查询,如何做到精确匹配
jlhde123 回复了问题 • 5 人关注 • 3 个回复 • 20318 次浏览 • 2018-04-10 19:30
node属性(tag)如何设置,查资料看到了好几种方法很混乱
yayg2008 回复了问题 • 4 人关注 • 1 个回复 • 6120 次浏览 • 2018-04-08 09:55
es集群中某一个节点忽然 bulk queue full
shjdwxy 回复了问题 • 4 人关注 • 3 个回复 • 6757 次浏览 • 2018-04-20 12:04
percentiles 和 percentiles ranks 的区别
rockybean 回复了问题 • 4 人关注 • 2 个回复 • 6742 次浏览 • 2018-04-04 07:59
prefix query查询不精确
strglee 回复了问题 • 4 人关注 • 1 个回复 • 3588 次浏览 • 2018-04-03 13:10
ES has_parent 未返回全部数据
laoyang360 回复了问题 • 2 人关注 • 1 个回复 • 4029 次浏览 • 2018-04-02 21:51
es snapshot的时候 索引支持模糊吗 有什么办法可以支持呢
回复chenkun0209 发起了问题 • 2 人关注 • 0 个回复 • 2706 次浏览 • 2018-04-02 17:54
重要级别的es集群该怎么保护。
laoyang360 回复了问题 • 5 人关注 • 2 个回复 • 1981 次浏览 • 2018-04-02 21:58
elasticsearch 中的 GET 有大小限制吗?
strglee 回复了问题 • 2 人关注 • 1 个回复 • 2424 次浏览 • 2018-04-02 16:30
32亿级别的数据,2.83TB 集群如何配置 分片如何配置,求大神指点
code4j 回复了问题 • 9 人关注 • 4 个回复 • 2944 次浏览 • 2018-04-03 11:24