itext pdf问题

时间:2011-08-15 20:11:40

标签: pdf itext

我有一个问题,我正在尝试打开一个用Quark 8.51编码的pdf并使用itext从文档中提取文本,但是当它打开时,只有一大堆乱码符号和无意义的单词。有没有人有任何建议?

2 个答案:

答案 0 :(得分:0)

您是否曾在IText邮件列表上询问过或尝试过任何其他提取库,例如jpedal或PdfBox?

答案 1 :(得分:0)

如果试图阅读其他任何内容,那么只是纯文本它将无法正常工作。其他可能导致问题的是编码