我正在尝试使用XPath将一些XML文档导入solr 7.5。 将简单的XML节点与solr字段匹配可以很好地工作。 我的问题是要根据子元素的值选择特定的元素。
在上面的示例中,我有一个文档,其中包含2个文件中的数据,我想在type=original
处提取图片的文件名。
<document>
<files>
<file>
<type>original</type>
<local_path>original.jpg</local_path>
</file>
<file>
<type>copy</type>
<local_path>copy.jpg</local_path>
</file>
</files>
</document>
我的Solr数据导入处理程序(DIH)行看起来像taht:
<field column="originalPic" xpath="/document/files/file[type = 'original']/local_path"/>
XPath表达式在pathtester.com或类似的东西上可以正常工作,但是在DIH导入期间它可能不会获取值,这会在solr.log中产生错误:
missing required field: originalPic