好时光!
我需要从pdf中提取文本,突出显示一些单词并将其写回。
我在PDFTextStriiper周围编写了包装器,用于公开方法getCharactersByArticle()
。
我遇到了2个麻烦。
1)坐标。我从阅读文件中得到的Y协调是相反的。如果我做了
contentStream.moveTextPositionByAmount(position.getX(), position.getY());
contentStream.drawString(position.getCharacter());
从底部开始的行打印在结果pdf的顶部,而从上一个pdf顶部开始的行打印在底部。
2)编码。文本正确加载。但它打印不正确。我需要使用西里尔语pdf,所以,smb知道,如何正确提取字体和编码。
contentStream.setFont(position.getFont(), position.getFontSize());
无效。
请有人帮助我!