标签: python text tiff tesseract
我有一个超过60页的pdf文件 我使用pyPdf将每个页面拆分为不同的pdf。现在,每个pdf都有一些数据表 然后我将这些pdf转换为.tif 我想使用tesseract或tesseract-ocr将数据表从.tif转换为文本。 我尝试了一些但没有奏效。
任何人都可以对此有任何想法吗?