使用XSLT强制删除一个缩写词列表

时间:2011-09-29 10:32:42

标签: regex xslt slug

需要从XML内容创建slug。

我正在导航从标题创建Slugs并找到下面的列表。

我一直在寻找XSL解决方案的完美解决方案,它可以像PHP解决方案一样提供更好的服务:http://blog.tersmitten.nl/slugify并且还可以处理文件系统中的重复项。

输入XML

<table>
    <tr>
        <td>2D</td>
        <td>Two Dimension</td>
    </tr>
    <tr>
        <td>A/C</td>
        <td>Account</td>
    </tr>
    <tr>
        <td>A/C</td>
        <td>Air Condition</td>
    </tr>
    <tr>
        <td>L&T</td>
        <td>Larsen & Toubro</td>
    </tr>
    <tr>
        <td>M + [ # ]</td>
        <td>Modified Algo</td>
    </tr>
</table>

预期产出

file: 2d.txt
------------
2D
Two Dimension

file: a-c.txt
-------------
A/C
Account

file: a-c-2.txt
---------------
A/C
Air Condition

file: l-t.txt
-------------
L&T
Larsen & Turbo

file: m.txt (NOT m-.txt)
-------------
M + [ # ]
Modified Algo

尝试过XSL

<?xml version="1.0"?>

<xsl:stylesheet extension-element-prefixes="redirect" version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:redirect="http://xml.apache.org/xalan/redirect">

    <xsl:output method="text" version="1.0" />

    <xsl:template match="/">
        <xsl:for-each select="table/tr">
            <!-- The logic for variable value requires attention!! -->
            <xsl:variable name="acronym" select="translate(td[1], 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz')" />
            <xsl:variable name="tmpFilename" select="concat('C:/Temp/', $acronym, '.txt')" />

            <xsl:variable name="filename">
                <xsl:choose>
                    <xsl:when test="document($tmpFilename)">
                        <!-- Require logic to handle duplicate file existence. -->
                    </xsl:when>
                    <xsl:otherwise>
                        <xsl:value-of select="$filename" />
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:variable>

            <redirect:write select="$filename">
                <xsl:value-of select="td[1]" />
                <xsl:text>&#10;</xsl:text>
                <xsl:value-of select="td[2]" />
            </redirect:write>
        </xsl:for-each>
    </xsl:template>
</xsl:stylesheet>

注意:文件名应仅包含操作系统支持的字符。其余的应转换为' - '。此外,不应该有前导和尾随' - '字符(例如上面提到的最后一个输出文件)。

0 个答案:

没有答案