我在utf-8中有一个带有编码属性的xml文件。
当我执行fop -xml xml.xml -xsl xsl.xsl -pdf pdf.pdf
时,我的输出pdf已经破坏了utf-8字符。重要的是,xsl文件中的文本没有utf-8字符,与xml中的文本相同。
Utf-8字符被#替换。
可能出现什么问题?
Xsl文件:
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format" xmlns:java="http://xml.apache.org/xslt/java" exclude-result-prefixes="java" version="1.0" xmlns="http://www.w3.org/1999/xhtml">
<xsl:output method="xml" version="1.0" indent="yes" encoding="UTF-8" />
<xsl:template match="/">
<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format">
<fo:layout-master-set>
<fo:simple-page-master master-name="A4" margin="1cm">
<fo:region-body margin="2cm" margin-left="1cm" margin-right="1cm"/>
<fo:region-before extent="3cm"/>
<fo:region-after extent="5mm"/>
</fo:simple-page-master>
</fo:layout-master-set>
<fo:page-sequence master-reference="A4">
<fo:static-content flow-name="xsl-region-before">
<fo:block font-size="24pt" font-family="Calibri">Filmoteka</fo:block>
</fo:static-content>
<fo:static-content flow-name="xsl-region-after">
<fo:block font-size="10pt" font-family="Calibri">Wygenerowano: <xsl:call-template name="dataCzas" /></fo:block>
</fo:static-content>
<fo:flow flow-name="xsl-region-body">
<fo:block font-size="12pt" font-family="Calibri" padding-after="1cm">
<fo:table table-layout="fixed" width="100%" border="solid black 1px">
<fo:table-column column-width="8mm"/>
<fo:table-column column-width="40mm"/>
<fo:table-column column-width="40mm"/>
<fo:table-column column-width="13mm"/>
<fo:table-column column-width="65mm"/>
<fo:table-header>
<fo:table-row>
<fo:table-cell border="solid black 2px">
<fo:block font-weight="bold" background-color="#cccccc">Lp.</fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 2px">
<fo:block font-weight="bold" background-color="#cccccc">Tytuł PL</fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 2px">
<fo:block font-weight="bold" background-color="#cccccc">Reżyseria</fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 2px">
<fo:block font-weight="bold" background-color="#cccccc">Rok</fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 2px">
<fo:block font-weight="bold" background-color="#cccccc">Obsada</fo:block>
</fo:table-cell>
</fo:table-row>
</fo:table-header>
<fo:table-body>
<xsl:apply-templates />
</fo:table-body>
</fo:table>
</fo:block>
</fo:flow>
</fo:page-sequence>
</fo:root>
</xsl:template>
<xsl:template match="film">
<fo:table-row>
<fo:table-cell border="solid black 1px">
<fo:block><xsl:number format="1"/></fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 1px">
<fo:block font-family="Calibri"><xsl:value-of select="tytul_pol"/></fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 1px">
<fo:block font-family="Calibri"><xsl:value-of select="rezyser"/></fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 1px">
<fo:block font-family="Calibri"><xsl:value-of select="rok"/></fo:block>
</fo:table-cell>
<fo:table-cell border="solid black 1px">
<fo:block font-family="Calibri"><xsl:value-of select="obsada"/></fo:block>
</fo:table-cell>
</fo:table-row>
</xsl:template>
<xsl:template name="dataCzas">
<xsl:value-of select="java:format(java:java.text.SimpleDateFormat.new('dd MMMM yyyy, HH:mm:ss'), java:java.util.Date.new())"/>
</xsl:template>
</xsl:stylesheet>
xml文件:
答案 0 :(得分:6)
如果FOP将字符输出为#
,则所选字体不包含表示它们的字形。
这可能是因为您的XML输入文件包含以下行:
<kraj>Francja, USA, Włochy</kraj>
这里有问题的人物是ł
。
所以,回答你的问题:FOP确实支持UTF-8,只是字体(在你的情况下:font-family='Calibri'
)没有表示字符的方法。
如果确实如此,FOP应该按照
的顺序输出警告WARNING: Glyph for "ł" not available in font "DejaVuSans"
现在,为了也考虑那些你选择的字体中没有的字符,要么完全改变输出字体,要么作为解决方法,用内联隔离它们。
例如,这就是为什么你要确保对于字符Σ
(数学运算符),选择了正确的字体:
<fo:block>
<fo:inline font-family='Symbol'>Σ</fo:inline>
</fo:block>
有关FOP字体的更多信息,请参阅此页:http://xmlgraphics.apache.org/fop/trunk/fonts.html。
答案 1 :(得分:0)
解决方案可能更简单。在我们的例子中,我们收到了缺少字形的警告,阅读了FOP字体配置网页并添加了
encoding-mode =“single-byte”
以Calibri字体定义嵌入完整字体。这解决了我们的问题(使用FOP 2.0)。