高峰只对攀登它而不是仰望它的人来说才有真正意义。

index中所有文档的词频统计

Elasticsearch | 作者 liuxing6 | 发布于2020年08月18日 | 阅读数:3725

我想统计一个index下的词频,比如我的数据中有一个text字段,我想统计所有文档的text字段中包含的词,并按照出现次数降序排列。此处指的词频是term_freq,而非聚合查询所得到的doc_freq。
在我的业务场景中,我无法指定某个词查询,因为我在查询时并不知道所有语句中有哪些词。
我曾在互联网上搜索过这个问题,但似乎只能找到要么是doc_freq(聚合查询),要么是需要指定一些内容的(termvectors需要指定某一特定文档)。
当然,我可以获取所有词,再对每个词查找,但这样效率会比较低。
希望有人能够指点一种实现方法,谢谢
已邀请:

laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自:

要回复问题请先登录注册