应用错误收集

我有一些文档，我用Xerox扫描仪将数字化为PDF文件。使用Java，我试图从中提取RGB像素数据，以用于图像识别应用程序。从头开始开发这个有点超出我的水平，所以我依靠第三方库进行PDF处理。

到目前为止，我已经尝试了2个不同的库; PdfBox和PdfClown。

使用PdfBox，我尝试使用convertToImage()方法获取BufferedImage。使用PdfClown，我尝试使用render(page,size)类中的Renderer方法获取BufferedImage。在这两种情况下，返回的图像都是空白的所有像素均为白色[(r,g,b) = (255,255,255)]。

我能够从其他不是来自扫描的pdf文档中获取非空白的BufferedImage，所以我怀疑问题在于扫描文档的格式。

以下是PFD文件示例：http://www.filedropper.com/innlevering1

有谁知道如何解决这个问题？或者你能提供不同的方法吗？

从Java中扫描的PDF文档中获取pixeldata

1 个答案: