xslt-fo不支持utf-8吗?

时间:2013-12-15 16:19:59

标签: xslt encoding xsl-fo apache-fop

我在utf-8中有一个带有编码属性的xml文件。

当我执行fop -xml xml.xml -xsl xsl.xsl -pdf pdf.pdf时,我的输出pdf已经破坏了utf-8字符。重要的是,xsl文件中的文本没有utf-8字符,与xml中的文本相同。

Utf-8字符被替换。

可能出现什么问题?

Xsl文件:

    <?xml version="1.0" encoding="UTF-8"?>

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format" xmlns:java="http://xml.apache.org/xslt/java" exclude-result-prefixes="java" version="1.0" xmlns="http://www.w3.org/1999/xhtml">
<xsl:output method="xml" version="1.0" indent="yes" encoding="UTF-8" />

<xsl:template match="/">
    <fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format">

        <fo:layout-master-set>
          <fo:simple-page-master master-name="A4" margin="1cm">
            <fo:region-body  margin="2cm" margin-left="1cm" margin-right="1cm"/>
            <fo:region-before extent="3cm"/>
            <fo:region-after extent="5mm"/>
          </fo:simple-page-master>
        </fo:layout-master-set>

        <fo:page-sequence master-reference="A4">
            <fo:static-content flow-name="xsl-region-before">
                <fo:block font-size="24pt" font-family="Calibri">Filmoteka</fo:block>
            </fo:static-content>
            <fo:static-content flow-name="xsl-region-after">
                <fo:block font-size="10pt" font-family="Calibri">Wygenerowano: <xsl:call-template name="dataCzas" /></fo:block>
            </fo:static-content>

            <fo:flow flow-name="xsl-region-body">
                <fo:block font-size="12pt" font-family="Calibri" padding-after="1cm">
                    <fo:table table-layout="fixed" width="100%" border="solid black 1px">
                    <fo:table-column column-width="8mm"/>
                    <fo:table-column column-width="40mm"/>
                    <fo:table-column column-width="40mm"/>
                    <fo:table-column column-width="13mm"/>
                    <fo:table-column column-width="65mm"/>
                        <fo:table-header>
                            <fo:table-row>
                                <fo:table-cell border="solid black 2px">
                                    <fo:block font-weight="bold" background-color="#cccccc">Lp.</fo:block>
                                </fo:table-cell>
                                <fo:table-cell border="solid black 2px">
                                    <fo:block font-weight="bold" background-color="#cccccc">Tytuł PL</fo:block>
                                </fo:table-cell>
                                <fo:table-cell border="solid black 2px">
                                    <fo:block font-weight="bold" background-color="#cccccc">Reżyseria</fo:block>
                                </fo:table-cell>
                                <fo:table-cell border="solid black 2px">
                                    <fo:block font-weight="bold" background-color="#cccccc">Rok</fo:block>
                                </fo:table-cell>
                                <fo:table-cell border="solid black 2px">
                                    <fo:block font-weight="bold" background-color="#cccccc">Obsada</fo:block>
                                </fo:table-cell>
                            </fo:table-row>
                        </fo:table-header>
                        <fo:table-body>
                            <xsl:apply-templates />
                        </fo:table-body>
                    </fo:table>
                </fo:block>
            </fo:flow>



        </fo:page-sequence>

    </fo:root>
</xsl:template>


<xsl:template match="film">
    <fo:table-row>
        <fo:table-cell border="solid black 1px">
            <fo:block><xsl:number format="1"/></fo:block>
        </fo:table-cell>
        <fo:table-cell border="solid black 1px">
            <fo:block font-family="Calibri"><xsl:value-of select="tytul_pol"/></fo:block>
        </fo:table-cell>
        <fo:table-cell border="solid black 1px">
            <fo:block font-family="Calibri"><xsl:value-of select="rezyser"/></fo:block>
        </fo:table-cell>
        <fo:table-cell border="solid black 1px">
            <fo:block font-family="Calibri"><xsl:value-of select="rok"/></fo:block>
        </fo:table-cell>
        <fo:table-cell border="solid black 1px">
            <fo:block font-family="Calibri"><xsl:value-of select="obsada"/></fo:block>
        </fo:table-cell>
    </fo:table-row>
</xsl:template>

<xsl:template name="dataCzas">
    <xsl:value-of select="java:format(java:java.text.SimpleDateFormat.new('dd MMMM yyyy, HH:mm:ss'), java:java.util.Date.new())"/>
</xsl:template>

</xsl:stylesheet>

xml文件:

http://pastebin.com/fr9fChtn

2 个答案:

答案 0 :(得分:6)

如果FOP将字符输出为#,则所选字体不包含表示它们的字形。

这可能是因为您的XML输入文件包含以下行:

<kraj>Francja, USA, Włochy</kraj>

这里有问题的人物是ł

所以,回答你的问题:FOP确实支持UTF-8,只是字体(在你的情况下:font-family='Calibri')没有表示字符的方法。

如果确实如此,FOP应该按照

的顺序输出警告
WARNING: Glyph for "ł" not available in font "DejaVuSans"

现在,为了也考虑那些你选择的字体中没有的字符,要么完全改变输出字体,要么作为解决方法,用内联隔离它们。

例如,这就是为什么你要确保对于字符Σ(数学运算符),选择了正确的字体:

<fo:block> 
    <fo:inline font-family='Symbol'>Σ</fo:inline>
</fo:block>

有关FOP字体的更多信息,请参阅此页:http://xmlgraphics.apache.org/fop/trunk/fonts.html

答案 1 :(得分:0)

解决方案可能更简单。在我们的例子中,我们收到了缺少字形的警告,阅读了FOP字体配置网页并添加了

encoding-mode =“single-byte”

以Calibri字体定义嵌入完整字体。这解决了我们的问题(使用FOP 2.0)。