我有一个使用XML标记的信息数据库。 XML表示我想在搜索和查询中考虑的层次结构。例如,如果数据是图书元数据:
<book>
<author id="jd112">John Doe</author>
<title>John's First Publication</title>
<summary>This is a mundane memoir of John's life that no one else would care to read </summary>
</book>
我将拥有大量此类XML文档。我希望搜索者将查询限制在特定字段。我还想让搜索者对这些进行逻辑组合。
Lucene / Solr是否提供这样的能力,还是应该关注其他技术? 如果它是Lucene,指向我将如何进行此操作会有所帮助。
感谢您的见解。
-Raj
答案 0 :(得分:1)
是的,这是使用它的最佳方式,但文档应该重新格式化
http://www.xml.com/pub/a/2006/08/09/solr-indexing-xml-with-lucene-andrest.html
和google有关配置schema.xml的信息
答案 1 :(得分:0)
您可以导入xml文件,而无需将其自身转换为Sorl xml格式,只需使用DataImportHandler并应用an xsl tranformation
答案 2 :(得分:0)
有几种索引XML文档的方法。
希望这会有所帮助