java - pdfbox文本位置和编码问题

时间:2014-04-05 20:10:43

标签: java pdf encoding fonts pdfbox

好时光! 我需要从pdf中提取文本,突出显示一些单词并将其写回。 我在PDFTextStriiper周围编写了包装器,用于公开方法getCharactersByArticle()。 我遇到了2个麻烦。 1)坐标。我从阅读文件中得到的Y协调是相反的。如果我做了

contentStream.moveTextPositionByAmount(position.getX(), position.getY());
contentStream.drawString(position.getCharacter());

从底部开始的行打印在结果pdf的顶部,而从上一个pdf顶部开始的行打印在底部。

2)编码。文本正确加载。但它打印不正确。我需要使用西里尔语pdf,所以,smb知道,如何正确提取字体和编码。

contentStream.setFont(position.getFont(), position.getFontSize());

无效。

请有人帮助我!

0 个答案:

没有答案