我想从java中的一个非常大的文本文件创建一个索引文件。实际上我想保留索引文件中每行中第一个字符的数字和字节。我将使用它在我原始文件中尽可能快地进行搜索。
如果有人可以帮我提供示例代码,那就太棒了。
答案 0 :(得分:4)
您检查过Apache Lucene吗?
答案 1 :(得分:0)
索引文件只是一个映射Word - >地点。对于简单的问题,您可以使用Multimap从单词到文件中单词的位置自行构建。
如果您需要停止列表,词干和其他语言处理,预搜索,后搜索或中缀搜索,您应该考虑使用搜索引擎。