我有几千个xsl文件,我需要对它们进行转换,以便在Solr中对它们进行索引。我已经这样做但我需要每个文件都有一个与文件名相同的字段ID。 文件如下所示:
<TEXT>
<TITLE>A Title</TITLE>
<DATELINE> A Dateline </DATELINE>
<BODY> text </BODY>
</TEXT>
例如:我的文件&#39;名字就像&#34; 0001.xsl&#34;,&#34; 0002.xsl&#34;等等。 我需要有类似的东西:
<?xml version="1.0" encoding="UTF-8"?>
<add>
<doc>
<field name="ID">0001</field>
<field name="TITLE">-a tile-</field>
<field name="DATELINE">-a dateline-</field>
<field name="BODY"> -text-</field>
</field>
</doc>
</add>
这是样式表:
<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<!-- use this for debugging only -->
<!-- <xsl:output method="xml" indent="yes"/> -->
<xsl:template match="*">
<xsl:element name="field">
<xsl:attribute name="name">
<xsl:value-of select="name()"/>
</xsl:attribute>
<xsl:value-of select="."/>
</xsl:element>
</xsl:template>
<xsl:template match="/">
<add>
<doc>
<xsl:apply-templates select="//TEXT/*"/>
</doc>
</add>
</xsl:template>
</xsl:stylesheet>
我该怎么做?我是否需要更改stylesheeet或者在阅读文件名后可以使用Java添加特定字段? 我正在使用Java来转换文件并为它们编制索引。
答案 0 :(得分:1)
当您使用Java时,您可以切换到Saxon和XSLT 2.0,您可以在其中读取文档URI并将其标记为将其拆分以提取文件名。或者使用XSLT 1.0处理器,假设您使用知道文件名的Java代码运行转换以在其上运行转换,您可以考虑在运行转换之前定义Java代码设置为文件名的全局参数。 XSLT读出来了:
<xsl:param name="file-id"/>
<xsl:template match="/">
<add>
<doc>
<field name="ID"><xsl:value-of select="$file-id"/></field>
<xsl:apply-templates select="//TEXT/*"/>
</doc>
</add>
</xsl:template>
请注意,您的其他模板相当冗长,可以缩短为
<xsl:template match="*">
<field name="{name()}">
<xsl:value-of select="."/>
</field>
</xsl:template>