如何从PDF中删除蒙版或损坏的图像?

时间:2017-02-14 12:44:32

标签: ruby-on-rails ubuntu poppler

我正在开发一个Ruby on Rails应用程序,用于从PDF文件中提取文本和图像。在提取图像时,其中很少会被破坏。

提取后有没有办法识别那些损坏的图像?有人知道他们为什么会被腐化吗?

我正在使用pdftohtmlpdftotext(poppler)Ubuntu实用程序。

提前致谢。

0 个答案:

没有答案