这是我解析pdf文档的代码:
classObject
使用此代码,我可以解析许多pdf文档,但是我只能在pdf文档中阅读中文,这是意外的。
我刚刚在github上共享了包含以下内容的文档:
String str="";
try
{
PdfReader m_reader;
m_reader = new PdfReader("E:\\ERR1.pdf");
str=PdfTextExtractor.getTextFromPage(m_reader, 1);
} catch (IOException e) {
e.printStackTrace();
}
System.out.println(str);
与存储库的内容有关。 README.md
是我可以读取和解析的文件,它有所更改。ERR1-modified.pdf
是我无法解析的文件,除了中文。