我有一个巨大的XML文件,大小约2GB,包含简历。此文件中有数千个简历,标记正确。现在我正在使用XPATH来查询它。那么建议使用Lucene代替XPATH吗?
答案 0 :(得分:3)
取决于您的要求。如果您需要全文搜索以及全面搜索引擎的所有其他强大功能,Lucene是您的最佳选择。我建议建立在lucene之上的Solr,并提供更好的API和抽象。
答案 1 :(得分:1)
与所有其他技术相关,取决于它。
Lucene给你的是你没有使用XPath是全文引擎的强大功能,它支持排名以及短语查询,通配符查询等功能。
根据您的用例,我会说全文搜索引擎是有道理的。这并不是说香草Lucene是最好的方式(例如,其他替代品建立在Lucene上)。
答案 2 :(得分:1)
2GB似乎相当少,我会建立自己的倒排索引(最小的一个):)但是使用Lucene / Solr虽然没问题。前进。一旦你的记录开始加倍,它会帮助你。然而,在这种规模(2GB)甚至更大的许多现实生活中,正在使用类似关键字的SQL进行数据库全文搜索。