我试图用Java中的Apache Lucene索引我硬盘上的一堆XML文件。我的想法是,为了获得最佳性能,将文件中的标记用作Lucene索引中的字段,因此当您在文件中搜索特定标记(例如,Ordernumber)时,Lucene查询将只是{{ 1}}。
例如,我有一个文件的这一部分:
ordernumber:123
现在可以索引XML文件,以便我可以使用查询<contactPerson>
<identification>
<source>CUSTOMER</source>
<sourceId>12345678</sourceId>
</identification>
<lastName>Vader</lastName>
<firstName>Darth</firstName>
<telefon>0000</telefon>
<emailAddress>darth.vader@Imperium.com</emailAddress>
<roleType>ORDERER</roleType>
</contactPerson>
来查找姓氏吗?您会建议更好的搜索XML文件的解决方案吗?是否可以使用我可以使用的开箱即用功能?如果XML文件存储在数据库中会更容易吗?
此外,稍后我将使用Elasticsearch或Solr执行相同的任务,但XML文件将在数据库中。使用其中一种时可以使用哪些不同的选项?