各位大佬 我现在想实现查询 “事”,“务日”或者“事务日志确保” 都能将下面的语句匹配到
Elasticsearch | 作者 hanxiaobei | 发布于2019年08月29日 | 阅读数:1478各位大佬 我现在想实现查询 “事”,“务日”或者“事务日志确保” 都能将下面的语句匹配到
“Elasticsearch事务日志确保可以安全地将数据索引到Elasticsearch,而无需为每个文档执行低级Lucene提交。”
现在是 ngram(一个字一个字的分词) + match_phrase 来做的 但是由于文本比较大 生成 .pos文件就很大 索引也就非常大
2 个回复
hanxiaobei - 90后小白
赞同来自:
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
赞同来自:
类似问题的解决方案:
1、你的ngram细分;
2、动态更新词典+动态reindex(周期性的,无法保证最新词的实时检索生效),不过再动态把“务日”非关键词作为一个词写入就得看你具体业务了,看着怪怪的。
3、使用wildcard模糊匹配,万不得已,性能角度非常不推荐。
4、字词混合索引,开头我提供的链接。