从Python运行pdftotext

时间:2015-10-23 08:28:22

标签: python windows subprocess pdftotext

我正在尝试使用pdftotext软件将pdf文档转换为文本文档。

我需要从python脚本调用此应用程序inc命令提示符来转换文件。

我有以下代码:

import os 
import subprocess

path = "C:\\Users\\..." 
pdffname = "pdffilename.pdf" 
txtfname = "txtfilename.txt"

subprocess.call(['pdftotext', '-layout', 
     os.path.join(path, pdffname),
     os.path.join(path, txtfname)])

当我运行此代码时,我收到错误

  File "C:/Users/.../code-1.py", line 44, in <module>
    os.path.join(path, txtfname)])

  File "C:\Anaconda\lib\subprocess.py", line 522, in call
    return Popen(*popenargs, **kwargs).wait()

  File "C:\Anaconda\lib\subprocess.py", line 710, in __init__
    errread, errwrite)

  File "C:\Anaconda\lib\subprocess.py", line 958, in _execute_child
    startupinfo)

WindowsError: [Error 2] The system cannot find the file specified

您能否帮助从python调用pdftotext应用程序将pdf转换为文本文件。

1 个答案:

答案 0 :(得分:1)

我有同样的错误,除了Popen。我通过在子进程调用中提供pdftotext.exe的完整路径来修复它。别忘了逃避反击。

我对Anaconda了解不多,我自己也没有对此进行过测试,但我认为Conda可能在Windows上引用脚本时遇到问题:fix references to scripts on windows