我检查过Lucene索引文件的方式。但我需要索引键值对。就像我在一个文件或少量文件中有很多(单词,句子)组合。大多数情况下,它都在单个文件中。
我想根据用于搜索的单词搜索句子。我需要使用Java的机制是什么?
类似于Hadoop中的Sequence文件。如果不解析整个数据,我们应该能够获得每个可用密钥的值。
答案 0 :(得分:0)
我认为你可以将文件分成句子,用lucene文件索引每个句子并将文件信息放入文件中。然后你可以搜索一些单词来获得句子和文件信息。
例如。 doc.add(new TextField("content", content, Field.Store.YES));
`doc.add(new TextField("fileinfo", fileinfo, Field.Store.YES));`