xsl到xml转换添加非现有字段?

时间:2015-07-06 07:54:58

标签: java xml xslt indexing solr

我有几千个xsl文件,我需要对它们进行转换,以便在Solr中对它们进行索引。我已经这样做但我需要每个文件都有一个与文件名相同的字段ID。 文件如下所示:

<TEXT>&#2;
<TITLE>A Title</TITLE>
<DATELINE>    A Dateline </DATELINE>
<BODY> text </BODY>
</TEXT>

例如:我的文件&#39;名字就像&#34; 0001.xsl&#34;,&#34; 0002.xsl&#34;等等。 我需要有类似的东西:

<?xml version="1.0" encoding="UTF-8"?>
<add>
    <doc>
        <field name="ID">0001</field>
        <field name="TITLE">-a tile-</field>
        <field name="DATELINE">-a dateline-</field>
        <field name="BODY"> -text-</field>
</field>
    </doc>
</add>

这是样式表:

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">  

  <!-- use this for debugging only -->
  <!-- <xsl:output method="xml" indent="yes"/> -->

  <xsl:template match="*"> 
    <xsl:element name="field">
      <xsl:attribute name="name">
        <xsl:value-of select="name()"/>
      </xsl:attribute>
      <xsl:value-of select="."/>
    </xsl:element>
  </xsl:template>

  <xsl:template match="/">
    <add>
      <doc>        
        <xsl:apply-templates select="//TEXT/*"/>
      </doc>
    </add>
  </xsl:template>

</xsl:stylesheet>

我该怎么做?我是否需要更改stylesheeet或者在阅读文件名后可以使用Java添加特定字段? 我正在使用Java来转换文件并为它们编制索引。

1 个答案:

答案 0 :(得分:1)

当您使用Java时,您可以切换到Saxon和XSLT 2.0,您可以在其中读取文档URI并将其标记为将其拆分以提取文件名。或者使用XSLT 1.0处理器,假设您使用知道文件名的Java代码运行转换以在其上运行转换,您可以考虑在运行转换之前定义Java代码设置为文件名的全局参数。 XSLT读出来了:

  <xsl:param name="file-id"/>

  <xsl:template match="/">
    <add>
      <doc> 
        <field name="ID"><xsl:value-of select="$file-id"/></field>       
        <xsl:apply-templates select="//TEXT/*"/>
      </doc>
    </add>
  </xsl:template>

请注意,您的其他模板相当冗长,可以缩短为

  <xsl:template match="*"> 
    <field name="{name()}">
      <xsl:value-of select="."/>
    </field>
  </xsl:template>