在我的应用程序中,我从网上下载pdf文件。在android中是否可以将该pdf文件转换为文本(字符串或字符)?
请给我你宝贵的建议。
答案 0 :(得分:4)
实际上,可以将PDF转换为文本。比转换更好的术语是提取。
如果PDF仅包含图像,则只需要一个OCR工具。如果PDF是扫描文档的结果,则通常就是这种情况。但即便如此,扫描驱动程序通常会将文本作为不可见文本插入,以便可以搜索PDF内容。
答案 1 :(得分:0)
有些开源工具尝试这样做,尽管出于显而易见的原因,输出通常不够完美。
答案 2 :(得分:0)
结帐http://pdfbox.apache.org/。我没有使用它,也不知道它是否使用awt来处理pdf。由于android不支持awt plz检查awt用法。
答案 3 :(得分:-4)
Bruno Lowagie(iText开发人员)说不幸没有。
这很正常。这是PDF的“本质”。 PDF是一个单向过程。 PDF是最终产品。 您不应该将其转换为文本。
您需要一个OCR工具。
http://itext-general.2136553.n4.nabble.com/Convert-PDF-to-text-td2142916.html
关心Stefan