我正在使用Pytesseract读取PDF的特定部分。以下是我的代码,用于将tesseract配置为我的代码。
pytesseract.pytesseract.tesseract_cmd = os.path.join(cwd, "Tesseract-OCR\\tesseract.exe")
cwd 是我的SplitPDF.py文件和Tesseract-OCR(包含tesseract.exe)文件夹的目录。
当我执行SplitPDF.py时,一切正常,我得到了所需的输出。 但是,当我创建SplitPDF.exe(使用Pyinstaller)时,会出现问题,我收到一条错误消息,提示未安装tesseract.exe或它不在您的路径中。
以下是完整的错误:
回溯(最近通话最近):文件 run_tesseract中的“ site-packages \ pytesseract \ pytesseract.py”行223 init 中的文件“ subprocess.py”,行775, _execute_child FileNotFoundError中的第1178行:[WinError 2] 系统找不到指定的文件
在处理上述异常期间,发生了另一个异常:
回溯(最近一次通话最后一次):文件“ tkinter__init__.py”,行 1705,在调用文件“ PDF_Splitter.py”的第241行中,在UploadAction1中 pdfsplitbylca(entryString)文件“ Split_by_LCA_1.py”,第155行,在 pdfsplitbylca文字= pytesseract.image_to_string(im,lang ='eng') 在第345行中输入文件“ site-packages \ pytesseract \ pytesseract.py” image_to_string文件“ site-packages \ pytesseract \ pytesseract.py”,行 344,在文件“ site-packages \ pytesseract \ pytesseract.py”中, 253,在run_and_get_output文件中 run_tesseract中的第225行中的“ site-packages \ pytesseract \ pytesseract.py” pytesseract.pytesseract.TesseractNotFoundError: C:\ Users \ VADIRA〜1.KAT \ AppData \ Local \ Temp_MEI370202 \ Tesseract-OCR \ tesseract.exe 未安装或不在您的路径中
我无法正确创建.exe还是有更好的方法来配置Tesseract?
答案 0 :(得分:0)
您应该考虑使用Pytesseract
库(tesseract python库)而不是可执行文件。希望对您有所帮助。使用非常简单。您必须先安装它,然后才能使用
import pytesseract
from PIL import Image
pytesseract.image_to_string(Image.open('image'))
希望这会有所帮助