使用Android中的itext在嵌入在pdf中的图像中提取文本

时间:2017-02-07 07:38:57

标签: itext

我正在开发一个Android应用程序,我必须在其中解析pdf文件。一些pdf文件包含图像(图像包含文本)。我想解析图像中的文本。如何使用iText库

1 个答案:

答案 0 :(得分:2)

使用iText,您可以在pdf文档中提取图像。但iText不进行OCR(光学字符识别)。因此,您可以自己从图像中提取文本。

根据音量和您的具体使用情况,我建议您使用Google Cloud API。他们提供处理识别图像文本的解决方案。

或者,正如谷歌开发者控制台所说:“将Google Vision功能(包括图像标签,面部,徽标和地标检测,光学字符识别(OCR)以及显式内容检测)集成到应用程序中。”

结帐https://console.developers.google.com了解详情。

亲切的问候, 里斯