当源文档没有DOCTYPE时,如何使XSLT正常工作?

时间:2012-02-27 06:23:07

标签: xml xslt

我有以下XML文档:

<?xml version="1.0"  encoding="UTF-8"?>
<!DOCTYPE ONIXmessage SYSTEM "http://www.editeur.org/onix/2.1/short/onix-iternational.dtd">
<ONIXmessage release="2.1">
  <header>
    <m174>Some Publisher</m174>
    <m182>20090622</m182>
  </header>
  <product>
    <a001>160258186X</a001>
    <a002>03</a002>
    <productidentifier>
      <b221>15</b221>
      <b244>9781602581869</b244>
    </productidentifier>
    <b246>02</b246>
    <b012>BB</b012>
    <title>
      <b202>01</b202>
      <b203>The Acts of the Apostles</b203>
      <b030>The</b030>
      <b031>Acts of the Apostles</b031>
      <b029>Four Centuries of Baptist Interpretation</b029>
    </title>
  </product>
</ONIXmessage>

以及以下xslt:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format">
    <xsl:variable name="target"><xsl:choose>
        <xsl:when test="/ONIXMessage">short</xsl:when>
        <xsl:otherwise>reference</xsl:otherwise>
    </xsl:choose></xsl:variable>
    <xsl:output method="xml" doctype-system="http://www.editeur.org/onix/2.1/reference/onix-international.dtd"/>
    <xsl:template match="*">
        <xsl:variable name="target-name">
            <xsl:choose>
                <xsl:when test="$target='short' and @shortname"><xsl:value-of select="@shortname"/></xsl:when>
                <xsl:when test="$target='reference' and @refname"><xsl:value-of select="@refname"/></xsl:when>
                <xsl:otherwise><xsl:value-of select="name()"/></xsl:otherwise>
            </xsl:choose>
        </xsl:variable>
        <xsl:element name="{$target-name}">
            <xsl:copy-of select="@*[not(name()='refname' or name()='shortname')]"/>
            <xsl:apply-templates select="*|text()"/>
        </xsl:element>
     </xsl:template>
     <xsl:template match="text()">
        <xsl:copy/>
    </xsl:template>
</xsl:stylesheet>

当我应用XSLT时,输出是完美的。

如果我从源文档中删除DOCTYPE,那么xslt会复制到源而不进行任何更改。即使缺少doctype,我怎样才能使XSLT正常工作?

我正在使用以下命令进行测试

xsltproc stylesheet.xsl input.xml > output.xml

3 个答案:

答案 0 :(得分:3)

由于输入中没有@refname或@shortname,因此将输入复制到输出正是此转换似乎正在尝试执行的操作。如果打算做其他事情,你需要解释它是什么。您没有向我们展示DTD,但它有多种方式可以影响结果;例如,它可能声明了@refname或@shortname属性的默认值。如果是这种情况,那么由于样式表的行为取决于这些属性,没有它们就没有办法。

答案 1 :(得分:3)

对于此特定转换,请注意不推荐使用ONIX 2.1,并且Editeur不会提供http://www.editeur.org/onix/2.1/reference/onix-international.dtd。您必须在本地存储DTD。来自行业机构Editeur的注释here

答案 2 :(得分:1)

您可以在这样的预处理步骤中轻松地将DOCTYPE添加到XML文档

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"
 doctype-system=
 "http://www.editeur.org/onix/2.1/reference/onix-international.dtd"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="node()|@*">
  <xsl:copy>
   <xsl:apply-templates select="node()|@*"/>
  </xsl:copy>
 </xsl:template>
</xsl:stylesheet>

将此转换应用于没有DOCTYPE的XML文档(在这种情况下,已删除DOCTYPE的提供的XML文档):

<ONIXmessage release="2.1">
    <header>
        <m174>Some Publisher</m174>
        <m182>20090622</m182>
    </header>
    <product>
        <a001>160258186X</a001>
        <a002>03</a002>
        <productidentifier>
            <b221>15</b221>
            <b244>9781602581869</b244>
        </productidentifier>
        <b246>02</b246>
        <b012>BB</b012>
        <title>
            <b202>01</b202>
            <b203>The Acts of the Apostles</b203>
            <b030>The</b030>
            <b031>Acts of the Apostles</b031>
            <b029>Four Centuries of Baptist Interpretation</b029>
        </title>
    </product>
</ONIXmessage>

结果是相同的XML文档,但正确添加了DOCTYPE

<!DOCTYPE ONIXmessage
  SYSTEM "http://www.editeur.org/onix/2.1/reference/onix-international.dtd">
<ONIXmessage release="2.1">
   <header>
      <m174>Some Publisher</m174>
      <m182>20090622</m182>
   </header>
   <product>
      <a001>160258186X</a001>
      <a002>03</a002>
      <productidentifier>
         <b221>15</b221>
         <b244>9781602581869</b244>
      </productidentifier>
      <b246>02</b246>
      <b012>BB</b012>
      <title>
         <b202>01</b202>
         <b203>The Acts of the Apostles</b203>
         <b030>The</b030>
         <b031>Acts of the Apostles</b031>
         <b029>Four Centuries of Baptist Interpretation</b029>
      </title>
   </product>
</ONIXmessage>

现在,您可以成功地对预处理阶段的结果应用转换。