我正在用Java构建搜索引擎。搜索引擎应搜索80个文档中文本框中输入的单词,然后显示匹配文档的数量,该单词出现在每个文档中的次数。
首先,我导入了所有txt文件并创建了一个类Search。
我需要构建一个索引来索引80个文档中的每个单词,以便我可以开发一个算法来比较输入的单词和索引单词并返回结果。
任何有关开始的建议都会感激不尽!!
问候,
,私自。
答案 0 :(得分:10)
任何开始的建议都会感激不尽!
绝对 - Lucene:
Apache Lucene(TM)是一个完全用Java编写的高性能,功能齐全的文本搜索引擎库。它是一种适用于几乎所有需要全文搜索的应用程序的技术,尤其是跨平台搜索。
答案 1 :(得分:1)
看看FTS capabilities of SQLite。这应该做你想要的。