你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
发现
分享
文章
活动
登录
要不要再翻翻文档呢?
IK中文分词匹配,匹配度不符理想值
Elasticsearch
| 作者
夏李俊
| 发布于2017年09月13日 | 阅读数:
5302
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
使用IK中文分词匹配,搜索词为"水箱",对应结果有"水箱","水箱护罩","水箱水管","暖风水箱",然后按照匹配度_score排序,有时发现,个别"水箱护罩"的分数高于"水箱",不应该所有的"水箱"的匹配度最高才对么
没有找到相关结果
已邀请:
与内容相关的链接
提交
3 个回复
lz8086
-
es小司机
赞同来自:
已经有类似问题了,不过还需要个人理解
https://elasticsearch.cn/question/2275
Cheetah
赞同来自:
lucene打分除开权重主要是3方面,文档频率,长度,文档稀有度
文档频率不说了,你的例子里都一样,文档长度来讲,水箱的分值要高
现在出现"水箱护罩"分值高于“水箱”,那么唯一的因素就是文档稀有度得分低
那么文档稀有度这个如果没有特别指定都是按照分片算的,也就是说你这里可能存在"水箱护罩"所在分片数据"水箱"的稀有度得分很高
解决办法的话是将searchtype设置为dfs_query_then_fetch,那么计算文档稀有度的时候就会全局计算,不过肯定性能上就很差,不建议使用
夏李俊
赞同来自:
那请问,使用elastic原生java api时,如何指定query_type?
要回复问题请先
登录
或
注册
发起人
夏李俊
活动推荐
Aug
15
2025 Zabbix 中国峰会
上海
·
8-15 周五
·
报名中
Oct
17
第27届 GOPS 全球运维大会暨研运数智化技术峰会 · 上海站
上海
·
10-17 周五
·
报名中
相关问题
使用es做搜索,比如用户输入柠檬,搜出来的结果,柠檬汽水,柠檬位牙膏等在前面,真正想要的水果那个柠檬在后面。已经在中文分词中加了柠檬,还是不管用
除了设置mapping为not analyzied,还有其他方法让一个string字段不分词吗?
Elasticsearch查询时指定分词器
有没有Elastic Stack 5.X的中文文档可有参考?
添加了ik自定义分词,之前入库的数据不能搜索出来,这个有什么好的解决方法?
ik分词情况下“中国人民银行”为例,无法命中结果?
ES配置IK分词器失败
Elasticsearch 分词搜索 - 精确查找
执行GET _cat/indices?v结果的标题中文含义值什么
Elasticsearch中文分词器问题
es中字段如何匹配空字符串
问题状态
最新活动:
2017-09-13 18:02
浏览:
5302
关注:
3
人
3 个回复
lz8086 - es小司机
赞同来自:
https://elasticsearch.cn/question/2275
Cheetah
赞同来自:
文档频率不说了,你的例子里都一样,文档长度来讲,水箱的分值要高
现在出现"水箱护罩"分值高于“水箱”,那么唯一的因素就是文档稀有度得分低
那么文档稀有度这个如果没有特别指定都是按照分片算的,也就是说你这里可能存在"水箱护罩"所在分片数据"水箱"的稀有度得分很高
解决办法的话是将searchtype设置为dfs_query_then_fetch,那么计算文档稀有度的时候就会全局计算,不过肯定性能上就很差,不建议使用
夏李俊
赞同来自: