可以使用Solr或Lucene搜索XML吗?

时间:2012-07-19 16:46:29

标签: xml solr lucene

我有一个使用XML标记的信息数据库。 XML表示我想在搜索和查询中考虑的层次结构。例如,如果数据是图书元数据:

<book>
    <author id="jd112">John Doe</author>
    <title>John's First Publication</title>
    <summary>This is a mundane memoir of John's life that no one else would care to read </summary>
</book>

我将拥有大量此类XML文档。我希望搜索者将查询限制在特定字段。我还想让搜索者对这些进行逻辑组合。

Lucene / Solr是否提供这样的能力,还是应该关注其他技术? 如果它是Lucene,指向我将如何进行此操作会有所帮助。

感谢您的见解。

-Raj

3 个答案:

答案 0 :(得分:1)

是的,这是使用它的最佳方式,但文档应该重新格式化

http://www.xml.com/pub/a/2006/08/09/solr-indexing-xml-with-lucene-andrest.html

和google有关配置schema.xml的信息

答案 1 :(得分:0)

您可以导入xml文件,而无需将其自身转换为Sorl xml格式,只需使用DataImportHandler并应用an xsl tranformation

答案 2 :(得分:0)

有几种索引XML文档的方法。

  1. 您可以使用搜索引擎技术,例如Apache Sor 和ElasticSearch都基于Lucene进行索引。
  2. 使用NoSQL数据库技术,例如基于Lucene的LuX for XML

希望这会有所帮助