使用XSLT合并html文件?

时间:2018-01-23 08:31:35

标签: xml xslt xslt-2.0

我正在将多个html文件转换为一个文件,这意味着书中有多个章节。为此,我收到文件文件在哪里是文件列表的序列。在转换时,我没有得到章节的正确序列:

TXT FILE:

FilePath=d:\Amrendra\edgar xml-html\All\Edger_Final\xml\07_Document_Edgar17Nov.out.indd,d:\Amrendra\edgar xml-html\All\Edger_Final\xml\02_Document_Edgar17Nov.out.indd,d:\Amrendra\edgar xml-html\All\Edger_Final\xml\03_Document_Edgar17Nov.out.indd,d:\Amrendra\edgar xml-html\All\Edger_Final\xml\04_Document_Edgar17Nov.out.indd,d:\Amrendra\edgar xml-html\All\Edger_Final\xml\05_Document_Edgar17Nov.out.indd,d:\Amrendra\edgar xml-html\All\Edger_Final\xml\06_Document_Edgar17Nov.out.indd,d:\Amrendra\edgar xml-html\All\Edger_Final\xml\01_FrontMatter_Edgar17Nov.out.indd

用于合并的XSLT:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:xs="http://www.w3.org/2001/XMLSchema" exclude-result-prefixes="xs" version="2.0">

    <xsl:character-map name="m1">
        <xsl:output-character character="•" string="&amp;bull;"/>
        <xsl:output-character character="&#160;" string="&amp;nbsp;"/>
        <xsl:output-character character="’" string="&amp;rsquo;"/>

    </xsl:character-map>

    <xsl:output method="xhtml" use-character-maps="m1"/>
    <xsl:strip-space elements="*"/>

    <xsl:template match="@* | node()">
        <xsl:copy>
            <xsl:apply-templates select="@* | node()"/>
        </xsl:copy>
    </xsl:template>

    <xsl:variable name="filelist">
        <xsl:analyze-string select="unparsed-text('../book_bulidIndesign.txt')" regex="FilePath=(.*)">
            <xsl:matching-substring>
                <xsl:value-of select="normalize-space(regex-group(1))"/>
            </xsl:matching-substring>
        </xsl:analyze-string>
    </xsl:variable>

    <xsl:variable name="file-seq">
        <map>
        <xsl:for-each select="tokenize($filelist, ',')">
            <file>
                <xsl:attribute name="pos" select="position()"/>
                <xsl:value-of select="iri-to-uri(concat('file:///', replace(replace(replace(., '\\InDesign\\', '\\XML\\'), 'indd$', 'html'), '\\', '/')))"/>
            </file>
        </xsl:for-each>
        </map>
    </xsl:variable>


    <xsl:template match="/">
        <html>
            <body style="font: 10pt Times New Roman, Times, Serif">
                <xsl:for-each select="document($file-seq/map/file)">
                    <xsl:apply-templates select="/node()/body/node()"/>
                </xsl:for-each>
            </body>
        </html>
    </xsl:template>

</xsl:stylesheet>

注意:如果我尝试打印章节的映射,那么它的效果很好!所有html文件都在特定路径上可用。

3 个答案:

答案 0 :(得分:0)

在这个结构中:

<xsl:for-each select="document($file-seq/map/file)">
    <xsl:apply-templates select="/node()/body/node()"/>
</xsl:for-each>

规范声明:“[document]函数返回的节点序列是按文档顺序排列的,没有重复。这个顺序与...参数中提供URI的顺序没有必要的关系。”

如果您想要特定订单(保留重复项),您可以使用

实现此目的
<xsl:for-each select="$file-seq/map/file ! document(.)">
    <xsl:apply-templates select="/node()/body/node()"/>
</xsl:for-each>

“!” operator是XPath 3.0,在2.0中你可以改为:

<xsl:for-each select="$file-seq/map/file">
    <xsl:apply-templates select="document(.)/node()/body/node()"/>
</xsl:for-each>

实际上我并不是100%相信这会解决你的问题。我可能忽略了影响结果顺序的其他因素。但这肯定是你对结果顺序做出无根据假设的一个方面。

答案 1 :(得分:0)

要按文件中的文字内容对输出进行排序,只需在模板for-each后添加以下行:

<xsl:sort select="/node()/body/node()/text()" />

答案 2 :(得分:0)

感谢每个人提出的建议,我按照订单将文件存储在变量中,然后应用这些方式链接:

<xsl:variable name="filelist">
        <xsl:analyze-string select="unparsed-text('../book_bulidIndesign.txt')" regex="FilePath=(.*)">
            <xsl:matching-substring>
                <xsl:value-of select="normalize-space(regex-group(1))"/>
            </xsl:matching-substring>
        </xsl:analyze-string>
    </xsl:variable>

    <xsl:variable name="all-chapter">
        <xsl:for-each select="tokenize($filelist, ',')">
            <xsl:variable name="c_path">
                <xsl:value-of select="concat('file:///', iri-to-uri(replace(replace(replace(., '\\InDesign\\', '\\XML\\'), 'indd$', 'html'), '\\', '/')))"/>
            </xsl:variable>
            <xsl:copy-of select="document($c_path)"/>
        </xsl:for-each>
    </xsl:variable>

    <xsl:template match="/">
        <html>
            <body style="font: 10pt Times New Roman, Times, Serif">
                <xsl:apply-templates select="$all-chapter/node()/body/node()"/>
                <!--<xsl:apply-templates select="$all-chapter/node()"/>-->
            </body>
        </html>
    </xsl:template>