标签: lucene
目前我有很多想要索引的推文,但每个推文都是小文档。如果我将它们聚合成每个文件说100条推文,是否可以使用Lucene对它们进行索引,但同时保留推文ID(文件中存在的ID列)?
例如,每行如下所示:
TweetID | TweetText
谢谢, 安迪。
答案 0 :(得分:0)
Solr称这些“多值字段”,它们实现它的方式是通过偏移。基本上,你为每条推文分配200字节,然后将第n条推文的偏移量设置为200 *偏移量。
搜索时,你可以找回匹配的推文的偏移量,然后找出匹配的推文。