使用elasticsearch小白有几个问题,希望大佬能回答:
1.数据分类是使用_index还是type?
例如:全国数据,按省分类。是分_index好还是type,感觉两者没有什么太大的区别。
2.数据bulk写入
使用语句
curl -XPOST 'localhost:9200/_bulk?pretty' -H 'Content-Type: application/json' --data-binary @file
每个文档只能是10m左右,大了会报错?不知道原因。
3.数据更新
是用某个唯一字段去比对全库?然后去更新么?
4.搜索准确性
类似京东这种词只能给切词加字典了么?不然会匹配的北京东城。
或者说【电话销售】,【电销】,匹配或关系,但是,默认切词会切成【电话】,【销售】,【电销】去匹配。是不是也只能加入字典?但是这类宽泛的词态多了。不能碰到一个,字典里加一个,这样体验不好吧?
以上就是一个小白的困惑。先写过大家了。
1.数据分类是使用_index还是type?
例如:全国数据,按省分类。是分_index好还是type,感觉两者没有什么太大的区别。
2.数据bulk写入
使用语句
curl -XPOST 'localhost:9200/_bulk?pretty' -H 'Content-Type: application/json' --data-binary @file
每个文档只能是10m左右,大了会报错?不知道原因。
3.数据更新
是用某个唯一字段去比对全库?然后去更新么?
4.搜索准确性
类似京东这种词只能给切词加字典了么?不然会匹配的北京东城。
或者说【电话销售】,【电销】,匹配或关系,但是,默认切词会切成【电话】,【销售】,【电销】去匹配。是不是也只能加入字典?但是这类宽泛的词态多了。不能碰到一个,字典里加一个,这样体验不好吧?
以上就是一个小白的困惑。先写过大家了。
2 个回复
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
赞同来自: jnuc093 、toxindr
原本设计es 中,index代表关系型数据库中的数据库,type代表库表。现在我们应用中index代表库表的居多。
2,批量操作量大,不行就自己写程序实现,遍历,解析,插入即可。
3,更新id就可以。
4,用ik分词即可。设置好mapping
BrickXu - BlackOps@Qunar
赞同来自:
2. 报错贴一下。