在Windows和Python 2.6上使用子进程如下所示。我试图使用遗留解析器应用程序(假设parser.py)解析文本文件,如下所示:
import subprocess
k = subprocess.Popen(['python', 'parser.py', '-f C:\Report1\2011-03-14.txt'],
shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
print k.communicate()
这里的问题是文件名传递给遗留应用程序的方式,我无法更改代码但只能使用Python访问它。
它会生成以下错误:
IOError: [Errno 22] invalid mode (\'r\') or filename: C:\\Report1\\2011-03-14.txt
当我从traceback复制修改后的文件名(带有双正斜杠)以检查是否存在时,系统无法找到它。
问题:如何将路径作为参数传递,以便在不更改为双斜线的情况下对其进行处理,以便系统可以读取文件?
注意:os.sep也无法解决问题。
编辑:使用os.system执行工作完美,但问题是获取输出供以后使用。我目前在模块(run_parser.py)中使用os.sytem,然后在另一个模块(get_parse_status.py)中使用子进程,Popens run_parser.py来获取输出。我会感激任何比这更好的东西。
感谢您的时间。
答案 0 :(得分:3)
"C:\Report1\2011-03-14.txt"
与路径C:\Report1\2011-03-14.txt
不同。它实际上是一些字节串,'C:\\Report1\x811-03-14.txt'
。奇怪的是,听起来这不是你的问题,但它可能是相关的。 r"C:\Report1\2011-03-14.txt"
解决了这个问题。
但请注意,打印表示中的双反斜杠不会必然意味着实际上有两个反斜杠。 '\\'
是一个长度为1的Python字符串。
答案 1 :(得分:3)
更改参数列表以将路径编码为原始字符串:
k = subprocess.Popen(['python', 'parser.py', '-f', r'C:\Report1\2011-03-14.txt'],
shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
一个简单的程序,它读取文件并报告长度:
import sys
import os
userinput = sys.argv[1]
data = open(userinput, 'rb').read()
datalength = len(data)
fname = os.path.basename(userinput)
print "%s datasize = %s" % (fname, datalength)
然后通过翻译来调用它:
>>> k = subprocess.Popen(['python', 'test2.py', 'w:\bin\test2.py'], shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
>>> k.communicate()
5: ('Traceback (most recent call last):\r\n File "w:\\bin\\test2.py", line 4, in <module>
data = open(userinput, \'rb\').read()
IOError: [Errno 22] invalid mode (\'rb\') or filename: 'w:\\x08in\\test2.py', None)
>>> k = subprocess.Popen(['python', r'w:\bin\test2.py', r'w:\bin\test2.py'], shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
>>> k.communicate()
6: ('test2.py datasize = 194\n', None)
答案 2 :(得分:1)
“C:\ Report1 \ 2011-03-14.txt”与路径C:\ Report1 \ 2011-03-14.txt不同。它实际上是一些字节串,'C:\ Report1 \ x811-03-14.txt'。奇怪的是,听起来这不是你的问题,但它可能是相关的。 r“C:\ Report1 \ 2011-03-14.txt”解决了这个问题。
但请注意,打印表示中的双反斜杠并不一定意味着实际上有两个反斜杠。 '\'是长度为1的Python字符串。
你试过了吗?
from subprocess import Popen, PIPE
k = Popen(r'python parser.py -f "C:\Report1\2011-03-14.txt"',
shell=True,
stdout=PIPE,
stderr=STDOUT)
print k.communicate()
我发现通常在通过Popen在命令行上传递args时,将参数括在双引号中是唯一可靠的方法来使其表现。我也不总是信任调用Popen的list方法,并且通常自己编写命令。另请注意原始指标(r'')。