在我们的项目中,我们要求测试PDF文件数据。但PDF文件中的数据很少是图像格式,因此我们不能应用与PDF上的文本比较相同的逻辑。我们正面临验证PDF文件上的图像文本的问题。是否有任何API可以从中识别OCR并从图像中提取文本并进行比较。
答案 0 :(得分:0)
要处理图片,您可以尝试 -
答案 1 :(得分:0)
您可以预处理PDF文件吗?如果是,请尝试pdf2pdfocr(https://github.com/LeoFCardoso/pdf2pdfocr)。
免责声明:我是pdf2pdfocr开发者。