不使用PIL ImageFont渲染的Unicode字符

时间:2013-09-10 21:37:45

标签: python unicode python-imaging-library

我正在尝试使用方框绘图字符来编写tiff图像,但所有相关字符都显示为:this image

框绘制字符(例如“┌─┐│└┘╞═╡╤╧╘╛”)直接粘贴到源代码中,当它们保存到文本文件时它们会正确显示,但我不会明白为什么他们没有出现在图像上。

以下是我用于绘制图像的代码示例:

# coding=utf-8
text = "┌─┐│└┘╞═╡╤╧╘╛"
from PIL import Image, ImageDraw, ImageFont, TiffImagePlugin
img = Image.new("1",(1200,1600),1)
font = ImageFont.truetype("cour.ttf",14,encoding="unic")
draw = ImageDraw.Draw(img)
draw.text((40,0), text, font=font, fill=0)
img.save("imagefile.tif","TIFF")

我在Windows 7上使用python版本2.7.2。

1 个答案:

答案 0 :(得分:5)

我不确定这些是你的问题,因为有多种方法可以解决这个问题,所以我会讨论所有可能性:

首先,确保文件实际保存为UTF-8。默认情况下,记事本和许多其他编辑器将保存系统编码中的文件,这可能类似于cp1252。测试“它看起来正确”和“当脚本将这些字符写入文件并在记事本中打开该文件时,它看起来正确”并没有告诉你任何事情;很明显,如果你保存一个cp1252文件并将其打开为cp1252,它看起来是正确的。

只需将“coding = utf-8”添加到顶部并不会神奇地改变文件的保存方式(除了一些智能编辑器,如emacs)。它只是告诉Python“这个源文件是UTF-8”,即使它真的是别的东西。因此,Python最终将你的cp1252解释为UTF-8并获得mojibake,就像用a-with-circumflex代替线条绘制字符一样。

您通常最好使用显式反斜杠转义符,例如\u250c而不是┌─,尤其是如果您甚至不知道如何判断文件是否为UTF-8,更不用说如何解决它。

其次,你几乎不想把非ASCII字符放入str字面;除非你有充分的理由不这样做,否则请使用unicode字面值。

最重要的是,如果你传递draw.text一个str,PIL会使用您的默认字符集对其进行解码 - 这可能不是UTF-8。因此,即使到目前为止所有其他内容都是正确的,您的代码也会将一些UTF-8移交给解析为cp1252,所以再次使用mojibake。使用unicode字面值可以完全避免这个问题;否则,您需要通过text.decode('utf-8')

把所有这些放在一起:

text = u"\u250c\u2500\u2510\u2502\u2514\u2518\u255e\u2550\u2561\u2564\u2567\u2558\u255b"

现在编码声明和用于保存文件的实际编码无关紧要,因为该文件是纯ASCII。

但是你可能仍然会得到缺少字符的矩形,因为许多字体没有线条绘制字符。我不知道你的cour.ttf是什么,但我在我的系统上发现了两个Courier TTF字体,一个来自旧Mac OS,另一个来自Windows XP,而且没有一个拥有它们。如果这是你的问题,你显然需要使用不同的字体。

另一种可能性:如果您仍然使用上述修复程序获得mojibake,cour.ttf可能不是Unicode排序的字体文件,而是旧的TTF订单之一。字体查看器应显示文件的TTF顺序。 (我非常确定Windows附带一个,但我不知道它在Windows 7中的位置或如何使用它。)然后你需要传递正确的东西代替'unic'作为{{1加载字体时。但是大多数不是encodingunic的字体可能都不会有线条绘制字符。