应用错误收集

有没有办法在PDF文件上测试图像？

时间：2016-05-30 18:58:55

标签： java pdf selenium-webdriver ocr ui-automation

在我们的项目中，我们要求测试PDF文件数据。但PDF文件中的数据很少是图像格式，因此我们不能应用与PDF上的文本比较相同的逻辑。我们正面临验证PDF文件上的图像文本的问题。是否有任何API可以从中识别OCR并从图像中提取文本并进行比较。

2 个答案:

答案 0 :(得分：0)

要处理图片，您可以尝试 -

用于图像比较的Java，但在项目进行过程中处理代码变得非常困难。
我通常使用sikuli进行图像重组，并且它可以很好地下载sikuli形式here，并且对于sikuli plz的工作示例，请查看here。

答案 1 :(得分：0)

您可以预处理PDF文件吗？如果是，请尝试pdf2pdfocr（https://github.com/LeoFCardoso/pdf2pdfocr）。

免责声明：我是pdf2pdfocr开发者。