标签: pdf itext
我有一个问题,我正在尝试打开一个用Quark 8.51编码的pdf并使用itext从文档中提取文本,但是当它打开时,只有一大堆乱码符号和无意义的单词。有没有人有任何建议?
答案 0 :(得分:0)
您是否曾在IText邮件列表上询问过或尝试过任何其他提取库,例如jpedal或PdfBox?
答案 1 :(得分:0)
如果试图阅读其他任何内容,那么只是纯文本它将无法正常工作。其他可能导致问题的是编码