如何通过TF / IDF分数获取文档中的单词列表

时间:2016-11-17 05:37:15

标签: elasticsearch tf-idf

我有一个ElasticSearch索引。给定索引中的文档ID,我想通过TF-IDF得分获得文档中的单词列表。是否可以编写ES查询来获取列表?

提前致谢。

1 个答案:

答案 0 :(得分:3)

您可以检索文档中所有术语的列表,然后在搜索文档中的所有单词时使用说明。

例: 如果文档包含foo和bar,则查询将为:

/MY_INDEX/MY_TYPE/_search?q=_id:MY_ID foo bar&explain=true&size=1

在乐谱解释中,您将看到每个单词的idf分数和tf分数。