PDFBox支持多种字符集,包括CJK

时间:2016-10-12 12:28:21

标签: java pdfbox cjk

我正在尝试在需要在单个PDF上支持多种语言的情况下将文本写入PDF。这可能包括常规拉丁字符以及CJK字符。我已经尝试了许多尝试来做这个并让它从操作系统加载字符集而没有太大的成功。我得到的最远的是支持拉丁字符,阿拉伯语,俄语,我相信在嵌入字体示例中找到越南字符https://svn.apache.org/viewvc/pdfbox/trunk/examples/src/main/java/org/apache/pdfbox/examples/pdmodel/EmbeddedFonts.java?view=markup

我正在从示例中执行类似的方法,但我相信我正在使用FontMappers类提供的FileSystemFontProvider,例如

TrueTypeFont ttf = FontMappers.instance().getTrueTypeFont("Arial", null).getFont();
PDFont font = PDType0Font.load(signatureDocument, ttf.getOriginalData());

正如我所提到的,我似乎能够支持EmbeddedFonts示例中的文本,但似乎无法确定我如何也能支持CJK。当我尝试从中文,日文或韩文打印字符时,它会抛出IllegalArgumentException:字体ArialMT中的U +没有字形。

我目前正在使用2.0.2的PDFBox,但如果这样做有帮助,可能会升级到2.0.3。

0 个答案:

没有答案