我想阅读pdf表,现在我正在使用PDFxStream从PDF获取表数据,但是当我遇到日语字符时,它变成了像这样的奇怪字符“ ዊᮻᏒⒷⓄ䋳ৼ⋡䋱䋱⇟䋲ภ”,它会发出警告,因为有例外。
这是警告:
警告:由于异常{java.lang.IllegalArgumentException:IV缓冲区对于给定的偏移量/长度组合而言太短了},无法解析对象9,0的内容流(3food.pdf) java.lang.IllegalArgumentException:对于给定的偏移量/长度组合,IV缓冲区太短了
这是mycode:
public class Sample {
public static void main (String[] args) throws java.io.IOException {
//String pdfFilePath = args[0];
System.setProperty("pdfxs.config.property", "N");
Document pdf = PDF.open("3food.pdf");
StringBuilder text = new StringBuilder();
Page wantedPage = pdf.getPage(3);
wantedPage.pipe(new OutputTarget(text));
pdf.close();
System.out.println(text);
}
}
如果您有任何线索,我将不胜感激,谢谢您
答案 0 :(得分:1)
这实际上是PDFxStream版本3.7.0
中已修复的错误,可以在此处下载或将其包含在您的Maven版本中:
https://www.snowtide.com/downloads
此外,如果您对PDFxStream还有其他问题或疑问,我敦促您直接与我们联系@ https://www.snowtide.com/contact