我正在尝试使用pdftotext
软件将pdf文档转换为文本文档。
我需要从python脚本调用此应用程序inc命令提示符来转换文件。
我有以下代码:
import os
import subprocess
path = "C:\\Users\\..."
pdffname = "pdffilename.pdf"
txtfname = "txtfilename.txt"
subprocess.call(['pdftotext', '-layout',
os.path.join(path, pdffname),
os.path.join(path, txtfname)])
当我运行此代码时,我收到错误
File "C:/Users/.../code-1.py", line 44, in <module>
os.path.join(path, txtfname)])
File "C:\Anaconda\lib\subprocess.py", line 522, in call
return Popen(*popenargs, **kwargs).wait()
File "C:\Anaconda\lib\subprocess.py", line 710, in __init__
errread, errwrite)
File "C:\Anaconda\lib\subprocess.py", line 958, in _execute_child
startupinfo)
WindowsError: [Error 2] The system cannot find the file specified
您能否帮助从python调用pdftotext
应用程序将pdf转换为文本文件。
答案 0 :(得分:1)
我有同样的错误,除了Popen。我通过在子进程调用中提供pdftotext.exe的完整路径来修复它。别忘了逃避反击。
我对Anaconda了解不多,我自己也没有对此进行过测试,但我认为Conda可能在Windows上引用脚本时遇到问题:fix references to scripts on windows