使用Solr DataImportHandler访问xpath中的祖先值

时间:2011-10-20 16:54:52

标签: xpath solr

如果我的xml结构如下:

<fruit>
<apple appleId="apple_1">
 <core coreId="core_1">
  <seed>1</seed>
  <seed>2</seed>
 </core>
</apple>
<apple appleId="apple_2">
 <core coreId="core_1">
  <seed>1</seed>      
 </core>
</apple>
</fruit>

我希望种子成为我的solr模式中的文档,如何访问appleId和coreId?

以下是我的data-config.xml中的相关实体定义:

<entity name="apples"
            processor="XPathEntityProcessor"
            stream="true"
            forEach="/fruit/apple/core/seed"
            url="fruit.xml"
            transformer="script:create_id"
            >
    <field column="seed_s" xpath="/fruit/apple/core/seed" />
    <field column="apple_id_s" xpath="/fruit/apple/@appleId" />
</entity>

script:create_id为每个种子创建一个唯一的id。

在此示例中,apple_id_s将返回null。

1 个答案:

答案 0 :(得分:1)

我发现了问题。我需要使用commonField =“true”并确保遍历每个苹果和核心。另外,我需要设置pk =“seed_s”来触发solr来存储文档。

这是我的新实体定义:

<entity name="apples"
        processor="XPathEntityProcessor"
        stream="true"
        pk="seed_s"
        forEach="/fruit/apple/core/seed | /fruit/apple | /fruit/apple/core"
        url="fruit.xml"
        transformer="script:create_id"
        >
<field column="seed_s" xpath="/fruit/apple/core/seed" />
<field column="apple_id_s" xpath="/fruit/apple/@appleId" commonField="true"/>
<field column="core_id_s" xpath="/fruit/apple/core/@coreId" commonField="true"/>