pdf到文本的问题取决于PDF文件的版本

时间:2016-10-14 14:37:42

标签: linux parsing pdf text

我正在努力 ubuntu ,因为我正在尝试解析pdf文件以从中提取文本,我设法使其工作(例如使用tesseract ),但是当我得到一个 1.7 pdf文件版本时,转换不起作用(我在'name.txt'文件中得到一个空白页。)

所以我想知道是否有人知道可以解决我关于这个pdf版本问题的一些魔法...

我几乎无处不在地看着网络,没有看到类似的问题,因此我来到你们所有人。

希望你能找到一种方法来帮助我,因为谷歌到目前为止还不是这样的朋友......

0 个答案:

没有答案