你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
发现
分享
文章
活动
登录
提问:布和纸怕什么?
es分词排序问题
Elasticsearch
| 作者
MengPhantom
| 发布于2017年04月04日 | 阅读数:
5474
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
我现在用的一个中文分词插件,基本满足要求,但是有一点我想问一下,就是例如我想查找 `小车` ,查询结果排序是含`小车`的在前,然后是含`小`的在第二,`车`在第三位,这不是我想要的。也就是在分词的时候能不能降低形容词的优先级,一般中文里形容词在前面,当把词拆分为字单位的时候可不可reverse一下是不是更好。不知道有什么解决办法,es里面又这样的技巧么,或者是分词的问题,求指教
没有找到相关结果
已邀请:
与内容相关的链接
提交
2 个回复
wcb_dks
赞同来自:
搜索结果排序跟分词顺序没什么关系吧,排序应该和每个词的TF/IDF之类的参数有关,'小'排在'车'前面,很可能是因为'车'的文档频率比'小'要高。
要不就直接排除'小'这种形容词,不要让'小'作为一个词语被分出来
MengPhantom
赞同来自:
好的 使用停用词对吧
要回复问题请先
登录
或
注册
发起人
MengPhantom
活动推荐
Jun
17
搜索客 Meetup 讲师招募(长期有效)
线上
·
6-17 周一
·
进行中
Nov
30
【活动报名】ClickHouse Beijing User Group 第2届 Meetup
北京
·
11-30 周六
·
报名中
相关问题
这个问题有点难?
怎么解决elasticsearch集群占用太多虚拟内存(VIRT)的问题?占用了几十个G,有什么可以对它进行限制的相关设置吗?
集群稳定性的一些问题(一定量数据后集群变得迟钝)
elasticsearch functionScoreQuery scriptFunction效率问题
除了设置mapping为not analyzied,还有其他方法让一个string字段不分词吗?
Elasticsearch查询时指定分词器
elasticsearch 中的store 以及倒排索引的问题
es scroll查询全部数据问题
logstash获取时间的问题
索引某个shard无法恢复的问题
关于单个机器分片数容量问题
问题状态
最新活动:
2017-04-05 14:26
浏览:
5474
关注:
2
人
2 个回复
wcb_dks
赞同来自:
要不就直接排除'小'这种形容词,不要让'小'作为一个词语被分出来
MengPhantom
赞同来自: