在Lucene索引推文

时间:2011-12-10 08:25:10

标签: lucene

目前我有很多想要索引的推文,但每个推文都是小文档。如果我将它们聚合成每个文件说100条推文,是否可以使用Lucene对它们进行索引,但同时保留推文ID(文件中存在的ID列)?

例如,每行如下所示:

TweetID | TweetText

谢谢, 安迪。

1 个答案:

答案 0 :(得分:0)

Solr称这些“多值字段”,它们实现它的方式是通过偏移。基本上,你为每条推文分配200字节,然后将第n条推文的偏移量设置为200 *偏移量。

搜索时,你可以找回匹配的推文的偏移量,然后找出匹配的推文。