在较低级别

时间:2016-04-20 10:04:32

标签: indexing lucene information-retrieval


我们说我有一个令牌t =" string1"我想从lucene索引中找到出现此标记的所有文档。一种方法是使用此令牌进行查询并获取命中。但是,让我们有这样的许多令牌。为每个令牌发出一个查询肯定是无效的。那么,有没有办法有效地执行以下任务,可能通过访问较低级别的索引来避免不必要的开销 -

给定n个令牌(类似于字符串)为每个令牌找到一个列表,其中包含该令牌出现的documentID列表?

索引可能很大 - 17M文件和要搜索的令牌数量可以达到500个。

0 个答案:

没有答案