标签: indexing lucene information-retrieval
我们说我有一个令牌t =" string1"我想从lucene索引中找到出现此标记的所有文档。一种方法是使用此令牌进行查询并获取命中。但是,让我们有这样的许多令牌。为每个令牌发出一个查询肯定是无效的。那么,有没有办法有效地执行以下任务,可能通过访问较低级别的索引来避免不必要的开销 -
给定n个令牌(类似于字符串)为每个令牌找到一个列表,其中包含该令牌出现的documentID列表?
索引可能很大 - 17M文件和要搜索的令牌数量可以达到500个。