使用标记作为字段

时间:2015-08-13 11:14:23

标签: java xml indexing elasticsearch lucene

我试图用Java中的Apache Lucene索引我硬盘上的一堆XML文件。我的想法是,为了获得最佳性能,将文件中的标记用作Lucene索引中的字段,因此当您在文件中搜索特定标记(例如,Ordernumber)时,Lucene查询将只是{{ 1}}。

例如,我有一个文件的这一部分:

ordernumber:123

现在可以索引XML文件,以便我可以使用查询<contactPerson> <identification> <source>CUSTOMER</source> <sourceId>12345678</sourceId> </identification> <lastName>Vader</lastName> <firstName>Darth</firstName> <telefon>0000</telefon> <emailAddress>darth.vader@Imperium.com</emailAddress> <roleType>ORDERER</roleType> </contactPerson> 来查找姓氏吗?您会建议更好的搜索XML文件的解决方案吗?是否可以使用我可以使用的开箱即用功能?如果XML文件存储在数据库中会更容易吗?

此外,稍后我将使用Elasticsearch或Solr执行相同的任务,但XML文件将在数据库中。使用其中一种时可以使用哪些不同的选项?

0 个答案:

没有答案