我正在开发一个Android应用程序,我必须在其中解析pdf文件。一些pdf文件包含图像(图像包含文本)。我想解析图像中的文本。如何使用iText库
答案 0 :(得分:2)
使用iText,您可以在pdf文档中提取图像。但iText不进行OCR(光学字符识别)。因此,您可以自己从图像中提取文本。
根据音量和您的具体使用情况,我建议您使用Google Cloud API。他们提供处理识别图像文本的解决方案。
或者,正如谷歌开发者控制台所说:“将Google Vision功能(包括图像标签,面部,徽标和地标检测,光学字符识别(OCR)以及显式内容检测)集成到应用程序中。”
结帐https://console.developers.google.com了解详情。
亲切的问候, 里斯