迭代并将XSLT身份转换应用于文档目录?

时间:2016-01-15 12:15:34

标签: xml xslt xslt-2.0

我有一个包含HTML文件的文件夹,看起来或多或少是这样的:

<div id="d10e3019" class="content">
   <h1>header</h1>
   <div class="adv">
      <div class="warn">
         <img width="60px" height="20px" src="img/warn.png" alt="WARNING"></img>
         <p class="cause">gfgfg!</p>
         <p>⇒  Thgfh</p>
         <p class="step">⇔ 
            <span class="emphasis">hgfh
         </p>
      </div>
   </div>
</div>

他们都有<div id="someId" class="content">作为根元素,然后只有各种HTML标记。

我需要更改每个文档的src标记中的所有img属性,如下所示:

<img width="60px" height="20px" src="http://server.com/{$nameOfTheCurtentFolder}/img/warn.png" alt="WARNING"></img>

并使用新的子元素将新输出包装在另一个div中。文档的其余部分必须完全相同。

我尝试了这个样式表,但是使用这个样式表只有文本节点写在输出文档中(生成新的div元素时):

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version='2.0' xmlns:xsl='http://www.w3.org/1999/XSL/Transform' xmlns:xs='http://www.w3.org/2001/XMLSchema' xmlns:fn='http://www.w3.org/2005/xpath-functions' exclude-result-prefixes='xsl xs fn' xmlns:h="http://java.sun.com/jsf/html">
    <xsl:output method="xml" encoding="utf-8"/>
    <xsl:strip-space elements="*"/>

    <xsl:param name="files" select="collection('./output?select=*.html')"/>

    <xsl:template match="/">
        <xsl:for-each select="$files">
            <xsl:variable name="fileName" select="tokenize(base-uri(), '/')[last()]"/>
            <xsl:result-document method="xhtml" href="new/{$fileName}">
                <div>
                    <h:selectBooleanCheckbox value="pubs"/>
                    <xsl:copy>
                        <xsl:apply-templates select="@* | node()"/>
                    </xsl:copy>
                </div>
            </xsl:result-document>
        </xsl:for-each>
    </xsl:template>
    <xsl:template match="@src">
        <xsl:variable name="nameOfTheCurtentFolder" select="tokenize(base-uri(), '/')[last()-2]"/>
        <xsl:text>http://server.com/</xsl:text>
        <xsl:value-of select="$nameOfTheCurtentFolder"/>
        <xsl:text>/output/</xsl:text>
        <xsl:value-of select="."/>
    </xsl:template>
</xsl:stylesheet>

输出如下:

              <div>
                 <h:selectBooleanCheckbox value="pubs"/>
                  headergfgfg!⇒  Thgfhhgfh
              </div>

这是我之前的问题Change attribute value without creating new output document?

的后续行动

3 个答案:

答案 0 :(得分:2)

您的样式表似乎缺少标识转换模板:

<xsl:template match="@*|node()">
    <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
</xsl:template>

此外,为了更改属性的值,您需要先重新创建它:

<xsl:template match="@src">
    <xsl:attribute name="src">
        <xsl:variable name="nameOfTheCurtentFolder" select="tokenize(base-uri(), '/')[last()-2]"/>
        <xsl:text>http://server.com/</xsl:text>
        <xsl:value-of select="$nameOfTheCurtentFolder"/>
        <xsl:text>/output/</xsl:text>
        <xsl:value-of select="."/>
    </xsl:attribute>
</xsl:template>

最后,要处理的HTML文档也必须是格式良好的XML;提供的示例不是。

答案 1 :(得分:1)

也可以工作,只有5分钟太晚了(与michael.hor257k相比):

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version='2.0' xmlns:xsl='http://www.w3.org/1999/XSL/Transform' xmlns:xs='http://www.w3.org/2001/XMLSchema' xmlns:fn='http://www.w3.org/2005/xpath-functions' exclude-result-prefixes='xsl xs fn' xmlns:h="http://java.sun.com/jsf/html">
    <xsl:output method="xml" encoding="utf-8"/>
    <xsl:strip-space elements="*"/>
    <xsl:param name="files" select="collection('./output/*.xml')"/>
    <xsl:template match="/">
        <xsl:for-each select="$files">
            <xsl:variable name="fileName" select="tokenize(base-uri(), '/')[last()]"/>
            <xsl:result-document method="xhtml" href="new/{$fileName}">
                <div>
                    <h:selectBooleanCheckbox value="pubs"/>
                    <xsl:copy>
                        <xsl:apply-templates/>
                    </xsl:copy>
                </div>
            </xsl:result-document>
        </xsl:for-each>
    </xsl:template>
    <xsl:template match="@*|node()">
        <xsl:copy>
            <xsl:apply-templates select="@*|node()"/>
        </xsl:copy>
    </xsl:template>
    <xsl:template match="@src">
        <xsl:attribute name="src">
            <xsl:variable name="nameOfTheCurtentFolder" select="tokenize(base-uri(), '/')[last()-2]"/>
            <xsl:text>http://server.com/</xsl:text>
            <xsl:value-of select="$nameOfTheCurtentFolder"/>
            <xsl:text>/output/</xsl:text>
            <xsl:value-of select="."/>
        </xsl:attribute>
    </xsl:template>
</xsl:stylesheet>

答案 2 :(得分:1)

常规解决方案

XSLT没有标准方法来迭代文件目录。您需要通过外部控制应用XSLT来实现这样的效果。然而,$COMPILE -fPIC -o crash.o -c crash.cc \ && $COMPILE -o crash_test.o -c crash_test.cc \ && $COMPILE -fPIC $LINKER -shared -Wl,-soname,libcrash.so \ -o libcrash.so crash.o -Wl,-rpath=. \ && $COMPILE $LINKER crash_test.o -o crash_test \ -rdynamic libcrash.so -pthread -Wl,-rpath=. -Wl,--no-as-needed 函数的Saxon扩展可以做到这一点......

迭代输入文档并应用标识转换

collection()

当应用于您提供的输入HTML文件时,已更正格式正确:

The following XSLT will apply an adjusted identity transformation to all `$inSubdirName` HTML files and place the results in `$outSubdirName`:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version='2.0' xmlns:xsl='http://www.w3.org/1999/XSL/Transform'>
    <xsl:output omit-xml-declaration="yes"/>
  <xsl:strip-space elements="*"/>

  <xsl:param name="inSubdirName" select="'in'"/>
  <xsl:param name="outSubdirName" select="'out'"/>

  <!-- Driver for each file in inSubdirName -->
  <xsl:template match="/">
    <xsl:for-each select="collection(concat($inSubdirName, '/?select=*.html'))">
      <xsl:variable name="inFileName" select="base-uri()"/>
      <xsl:variable name="outFileName"
                    select="concat($outSubdirName, '/',
                            tokenize(base-uri(), '/')[last()])"/>
      <xsl:message select="concat('Transforming from ',
                           $inFileName, ' to ', $outFileName)"/>
      <xsl:result-document method="xhtml" href="{$outFileName}">
        <xsl:apply-templates select="@*|node()"/>
      </xsl:result-document>
    </xsl:for-each>
  </xsl:template>

  <!-- Identity transform -->
  <xsl:template match="@*|node()">
    <xsl:copy>
      <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
  </xsl:template>

  <!-- Identity transform overrides -->
  <xsl:template match="/div">
    <div xmlns:h="http://java.sun.com/jsf/html">
      <h:selectBooleanCheckbox value="pubs"/>
      <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>
    </div>
  </xsl:template>

  <xsl:template match="@src">
    <xsl:attribute name="src">
      <xsl:variable name="nameOfTheCurrentFolder"
                    select="tokenize(base-uri(), '/')[last()-2]"/>
      <xsl:text>http://server.com/</xsl:text>
      <xsl:value-of select="$nameOfTheCurrentFolder"/>
      <xsl:text>/output/</xsl:text>
      <xsl:value-of select="."/>
    </xsl:attribute>
  </xsl:template>

</xsl:stylesheet>

将使用新的<div id="d10e3019" class="content"> <h1>header 1</h1> <div class="adv"> <div class="warn"> <img width="60px" height="20px" src="img/warn.png" alt="WARNING"></img> <p class="cause">gfgfg!</p> <p>⇒ Thgfh</p> <p class="step">⇔ <span class="emphasis">hgfh</span> </p> </div> </div> </div> 属性以及新的@srcdiv子元素

对其进行转换
h:selectBooleanCheckbox

按要求,为<div xmlns:h="http://java.sun.com/jsf/html"> <h:selectBooleanCheckbox value="pubs"></h:selectBooleanCheckbox> <div id="d10e3019" class="content"> <h1>header 1</h1> <div class="adv"> <div class="warn"> <img width="60px" height="20px" src="http://server.com/xslt/output/img/warn.png" alt="WARNING"></img> <p class="cause">gfgfg!</p> <p>⇒ Thgfh</p> <p class="step">⇔ <span class="emphasis">hgfh</span> </p> </div> </div> </div> </div> 命名空间前缀添加了声明,以确保输出格式正确。

还要注意对原始XSLT的这些改进:

  • 输入和输出目录已参数化。
  • 执行迭代的驱动程序XSLT与之完全隔离 身份转换负责的XSLT模板 应用变化。