在我的申请中,我需要找出哪些文件出现在哪些文件中。如果我们只需要查找一个术语,这很好,但我必须找到所有术语的“地图”。下面的例子说明了我在寻找什么:
我想找到类似的东西(请考虑我们有一个字段“article_text”,文字类型一般):所以索引将是这样的(根据我的理解):
术语:发现此术语的Doc ID 阿克沙伊:1,2,3 俄罗斯:4,5,6 日本:23,54,21 。 。等等。我正在尝试为我的应用程序检索这种地图。字段“article_text”是多值的。我想在一个查询中检索所有术语的这种地图。
在稍微相关的说明中,很高兴知道我们是否也可以使用solrj获得tf.idf的索引。