有没有办法在PDF文件上测试图像?

时间:2016-05-30 18:58:55

标签: java pdf selenium-webdriver ocr ui-automation

在我们的项目中,我们要求测试PDF文件数据。但PDF文件中的数据很少是图像格式,因此我们不能应用与PDF上的文本比较相同的逻辑。我们正面临验证PDF文件上的图像文本的问题。是否有任何API可以从中识别OCR并从图像中提取文本并进行比较。

2 个答案:

答案 0 :(得分:0)

要处理图片,您可以尝试 -

  1. 用于图像比较的Java,但在项目进行过程中处理代码变得非常困难。

  2. 我通常使用sikuli进行图像重组,并且它可以很好地下载sikuli形式here,并且对于sikuli plz的工作示例,请查看here

答案 1 :(得分:0)

您可以预处理PDF文件吗?如果是,请尝试pdf2pdfocr(https://github.com/LeoFCardoso/pdf2pdfocr)。

免责声明:我是pdf2pdfocr开发者。