PDFxStream无法正确显示日语文本

时间:2018-07-23 06:55:58

标签: java pdf text

我想阅读pdf表,现在我正在使用PDFxStream从PDF获取表数据,但是当我遇到日语字符时,它变成了像这样的奇怪字符“ ዊᮻᏒⒷⓄ䋳ৼ⋡䋱䋱⇟䋲ภ”,它会发出警告,因为有例外。

这是警告:

  

警告:由于异常{java.lang.IllegalArgumentException:IV缓冲区对于给定的偏移量/长度组合而言太短了},无法解析对象9,0的内容流(3food.pdf)   java.lang.IllegalArgumentException:对于给定的偏移量/长度组合,IV缓冲区太短了

这是mycode:

public class Sample {
    public static void main (String[] args) throws java.io.IOException {
        //String pdfFilePath = args[0];
        System.setProperty("pdfxs.config.property", "N");
        Document pdf = PDF.open("3food.pdf");
        StringBuilder text = new StringBuilder();

        Page wantedPage = pdf.getPage(3);

        wantedPage.pipe(new OutputTarget(text));
        pdf.close();
        System.out.println(text);
      }
}

如果您有任何线索,我将不胜感激,谢谢您

1 个答案:

答案 0 :(得分:1)

这实际上是PDFxStream版本3.7.0中已修复的错误,可以在此处下载或将其包含在您的Maven版本中:

https://www.snowtide.com/downloads

此外,如果您对PDFxStream还有其他问题或疑问,我敦促您直接与我们联系@ https://www.snowtide.com/contact