Windows上的Python:路径作为子流程参数被修改并生成错误

时间:2011-03-14 18:48:51

标签: python subprocess

在Windows和Python 2.6上使用子进程如下所示。我试图使用遗留解析器应用程序(假设parser.py)解析文本文件,如下所示:

import subprocess
k = subprocess.Popen(['python', 'parser.py', '-f C:\Report1\2011-03-14.txt'],
                     shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
print k.communicate()

这里的问题是文件名传递给遗留应用程序的方式,我无法更改代码但只能使用Python访问它。

它会生成以下错误:

IOError: [Errno 22] invalid mode (\'r\') or filename: C:\\Report1\\2011-03-14.txt

当我从traceback复制修改后的文件名(带有双正斜杠)以检查是否存在时,系统无法找到它。

问题:如何将路径作为参数传递,以便在不更改为双斜线的情况下对其进行处理,以便系统可以读取文件?

注意:os.sep也无法解决问题。

编辑:使用os.system执行工作完美,但问题是获取输出供以后使用。我目前在模块(run_parser.py)中使用os.sytem,然后在另一个模块(get_parse_status.py)中使用子进程,Popens run_parser.py来获取输出。我会感激任何比这更好的东西。

感谢您的时间。

3 个答案:

答案 0 :(得分:3)

"C:\Report1\2011-03-14.txt"与路径C:\Report1\2011-03-14.txt不同。它实际上是一些字节串,'C:\\Report1\x811-03-14.txt'。奇怪的是,听起来这不是你的问题,但它可能是相关的。 r"C:\Report1\2011-03-14.txt"解决了这个问题。

但请注意,打印表示中的双反斜杠不会必然意味着实际上有两个反斜杠。 '\\'是一个长度为1的Python字符串。

答案 1 :(得分:3)

更改参数列表以将路径编码为原始字符串:

k = subprocess.Popen(['python', 'parser.py', '-f', r'C:\Report1\2011-03-14.txt'],
                     shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)

一个简单的程序,它读取文件并报告长度:

import sys
import os
userinput = sys.argv[1]
data = open(userinput, 'rb').read()
datalength = len(data)
fname = os.path.basename(userinput)
print "%s datasize = %s" % (fname, datalength)

然后通过翻译来调用它:

>>> k = subprocess.Popen(['python', 'test2.py', 'w:\bin\test2.py'], shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
>>> k.communicate()
5: ('Traceback (most recent call last):\r\n  File "w:\\bin\\test2.py", line 4, in <module>
data = open(userinput, \'rb\').read()
IOError: [Errno 22] invalid mode (\'rb\') or filename: 'w:\\x08in\\test2.py', None)
>>> k = subprocess.Popen(['python', r'w:\bin\test2.py', r'w:\bin\test2.py'], shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
>>> k.communicate()
6: ('test2.py datasize = 194\n', None)

答案 2 :(得分:1)

  

“C:\ Report1 \ 2011-03-14.txt”与路径C:\ Report1 \ 2011-03-14.txt不同。它实际上是一些字节串,'C:\ Report1 \ x811-03-14.txt'。奇怪的是,听起来这不是你的问题,但它可能是相关的。 r“C:\ Report1 \ 2011-03-14.txt”解决了这个问题。

     

但请注意,打印表示中的双反斜杠并不一定意味着实际上有两个反斜杠。 '\'是长度为1的Python字符串。

你试过了吗?

from subprocess import Popen, PIPE
k = Popen(r'python parser.py -f "C:\Report1\2011-03-14.txt"',
          shell=True, 
          stdout=PIPE, 
          stderr=STDOUT)
print k.communicate()

我发现通常在通过Popen在命令行上传递args时,将参数括在双引号中是唯一可靠的方法来使其表现。我也不总是信任调用Popen的list方法,并且通常自己编写命令。另请注意原始指标(r'')。