使用XProc将xml文档的每个节点保存为文件

时间:2014-03-17 14:26:12

标签: xml xslt xproc

我得到了一个带有以下结构的xml文档

<listOfNodes>
    <node name="file1">content1</node>
    <node name="file2">content2</node>
    ...
    <node name="fileN">contentN</node>
</listOfNodes>

我想用结果创建一个xproc管道:

  • file1.txt with content1
  • file2.txt with content2
  • ...
  • fileN.txt with contentN

我的第一个方法是:

<p:declare-step name="step_1" type="ts:Extract">
        <p:input port="source" />
        <p:filter select="nodes" name="step_1.1" />
         <p:for-each name="step_1.2">
            <p:iteration-source><p:pipe port="result" step="step_1.1"/></p:iteration-source>
            <p:store method="text" >
                 <p:with-option name="href" select="concat('file:/', 'step_1_',iteration-position(),'.txt')"/>
            </p:store>
        </p:for-each>
</p:declare-step>

但是我得到了DX0006错误。

有人可以帮助我吗?

3 个答案:

答案 0 :(得分:2)

如果content1,...,contentN是格式良好的XML,则以下管道可以解决这个问题:

<p:declare-step version="1.0" xmlns:p="http://www.w3.org/ns/xproc">
  <p:input port="source"/>
  <p:for-each>
    <p:iteration-source select="/*/node"/>
    <p:variable name="filename" select="concat(/node/@name, '.txt')"/>
    <p:unwrap match="/*"/>
    <p:store>
      <p:with-option name="href" select="$filename"/>
    </p:store>
  </p:for-each>
</p:declare-step>

如果content1,...,contentN不是运行良好的XML(纯文本,多个兄弟元素等),那么您可以在应用p:store之前将它们包装在XML包装元素中(或者只是#39; t应用p:unwrap步骤。如果您不想使用包装器元素,则标准p:store将不起作用(某些XProc实现可能支持p:store上的扩展属性以仅存储文档元素的内容;但是是另一个故事)。一种可能性是使用p:xslt代替。

答案 1 :(得分:1)

以下Pipeline完成工作:

<p:declare-step xmlns:p="http://www.w3.org/ns/xproc" xmlns:c="http://www.w3.org/ns/xproc-step" version="1.0">
    <p:input port="source" />
    <p:xslt name="create-document">
        <p:input port="source" />
        <p:input port="stylesheet">
            <p:document href="splitter.xsl" />
        </p:input>
        <p:input port="parameters"><p:empty/></p:input>
    </p:xslt>
    <p:for-each>
        <p:iteration-source>
            <p:pipe step="create-document" port="secondary" />
        </p:iteration-source>
            <p:store>
                <p:with-option name="method" select="'xml'" />
                <p:with-option name="href" select="p:base-uri(/*)" />
            </p:store>
        </p:for-each>

<p:sink>
    <p:input port="source"><p:pipe port="result" step="create-document"/></p:input>
</p:sink>
</p:declare-step>

但我还必须在xslt文件中拆分文件:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

    <xsl:template match="node">
        <xsl:variable name="filename" select="concat(@name,'.txt')" />
        <saveTo><xsl:value-of select="$filename" /></saveTo>
        <xsl:result-document href="{$filename}">
            <node><xsl:value-of select="current()" /></node>
        </xsl:result-document>
    </xsl:template>

    <!-- standard copy template -->
    <xsl:template match="@*|node()">
        <xsl:copy>
            <xsl:apply-templates select="@*"/>
            <xsl:apply-templates/>
        </xsl:copy>
    </xsl:template> 
</xsl:stylesheet>

答案 2 :(得分:0)

只是为了理解为什么你的代码会抛出错误,我自己试了一下。但无法重现您的错误。这在XMLCalabash中运行得很好:

<p:declare-step name="step_1" type="ts:Extract" version="1.0" xmlns:p="http://www.w3.org/ns/xproc" xmlns:ts="ts">
    <p:input port="source" />
    <p:filter select="/*/node" name="step_1.1" />
     <p:for-each name="step_1.2">
        <p:iteration-source><p:pipe port="result" step="step_1.1"/></p:iteration-source>
        <p:store method="text" >
             <p:with-option name="href" select="concat('step_1_', p:iteration-position(), '.txt')"/>
        </p:store>
    </p:for-each>
</p:declare-step>

请注意,我必须添加p和ts命名空间声明,并且我还在interation-position()之前添加了p :.我删除了&#39;文件:/&#39;由于实际原因,文件是在我的文件系统的根目录中写的。

我找不到DX0006错误的记录。也许它尝试在你的机器的根目录中编写文件,但是不允许这样做?

HTH!