你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
发现
分享
文章
活动
登录
Q:非洲食人族的酋长吃什么?
咨询下,有没有根据英文词根分词的分词器
Elasticsearch
| 作者
dongxiao
| 发布于2019年12月18日 | 阅读数:
2592
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
请问一下,如果我需要对英文词根进行分词,有没有类似的分词器,比如telephone,我能根据词根分词成 tele 和 phone这样的,我们目前在做搜索,希望用户输入的能尽量匹配,所以希望有类似的分词器,可以将内容分词成更多的模式
没有找到相关结果
已邀请:
与内容相关的链接
提交
2 个回复
locatelli
赞同来自:
dongxiao
可能有两个思路,一个是用stemmer分词器,但不知道是不是满足你的需要。
另外一个是用decompounder分词器 (
https://www.elastic.co/guide/e ... .html
)。本身英语里面是不太有复合词的,比如telephone实际上被考虑为一个词而不是tele和phone合成起来。所以decompounder分词器原来是为德语、芬兰语之类的语言准备的。如果你可以自己准备英文字典,那么应该也可以用
匿名用户
赞同来自:
dongxiao
如果是固定需求可以换个思路,
比如telephone
你就想拆分成tele和phone,而不是 tel 和ephone,那完全可以增加一个字段去处理,相关的过滤器,分析器都有。
或者就用楼上的方法。但是楼上的方法,能百分百实现也行、
Snowball Token Filter
Stemmer Token Filter
Stemmer Override Token Filter
要回复问题请先
登录
或
注册
发起人
dongxiao
活动推荐
Oct
17
第27届 GOPS 全球运维大会暨研运数智化技术峰会 · 上海站
上海
·
10-17 周五
·
报名中
相关问题
除了设置mapping为not analyzied,还有其他方法让一个string字段不分词吗?
Elasticsearch查询时指定分词器
添加了ik自定义分词,之前入库的数据不能搜索出来,这个有什么好的解决方法?
ik分词情况下“中国人民银行”为例,无法命中结果?
ES配置IK分词器失败
Elasticsearch中文分词器问题
Elasticsearch 分词搜索 - 精确查找
IK分词器对数字是不是不分词?
ik 分词 远程扩展字典能配制调用频率吗
ES使用IK分词器
ik分词器搜不出单个中文词
问题状态
最新活动:
2019-12-19 20:07
浏览:
2592
关注:
2
人
2 个回复
locatelli
赞同来自: dongxiao
另外一个是用decompounder分词器 (https://www.elastic.co/guide/e ... .html)。本身英语里面是不太有复合词的,比如telephone实际上被考虑为一个词而不是tele和phone合成起来。所以decompounder分词器原来是为德语、芬兰语之类的语言准备的。如果你可以自己准备英文字典,那么应该也可以用
匿名用户
赞同来自: dongxiao
比如telephone
你就想拆分成tele和phone,而不是 tel 和ephone,那完全可以增加一个字段去处理,相关的过滤器,分析器都有。
或者就用楼上的方法。但是楼上的方法,能百分百实现也行、
Snowball Token Filter
Stemmer Token Filter
Stemmer Override Token Filter