标签: linux parsing pdf text
我正在努力 ubuntu ,因为我正在尝试解析pdf文件以从中提取文本,我设法使其工作(例如使用tesseract ),但是当我得到一个 1.7 pdf文件版本时,转换不起作用(我在'name.txt'文件中得到一个空白页。)
所以我想知道是否有人知道可以解决我关于这个pdf版本问题的一些魔法...
我几乎无处不在地看着网络,没有看到类似的问题,因此我来到你们所有人。
希望你能找到一种方法来帮助我,因为谷歌到目前为止还不是这样的朋友......