为什么我不能以中文以外的其他语言在pdf文档中使用IText?

时间:2019-04-03 08:18:07

标签: java parsing pdf itext

这是我解析pdf文档的代码:

classObject

使用此代码,我可以解析许多pdf文档,但是我只能在pdf文档中阅读中文,这是意外的。

我刚刚在github上共享了包含以下内容的文档:

  • String str=""; try { PdfReader m_reader; m_reader = new PdfReader("E:\\ERR1.pdf"); str=PdfTextExtractor.getTextFromPage(m_reader, 1); } catch (IOException e) { e.printStackTrace(); } System.out.println(str); 与存储库的内容有关。
  • README.md是我可以读取和解析的文件,它有所更改。
  • ERR1-modified.pdf是我无法解析的文件,除了中文。

0 个答案:

没有答案