转义文件路径中的空间

时间:2013-08-08 21:45:39

标签: python regex

我正在尝试编写一个读取日志文件并处理它的python工具

它应该做的一件事是使用日志文件中列出的路径(它是备份工具的日志文件)

/Volumes/Live_Jobs/Live_Jobs/*SCANS\ and\ LE\ Docs/_LE_PROOFS_DOCS/JEM_lj/JEM/0002_OXO_CorkScrew/3\ Delivery/GG_Double\ Lever\ Waiters\ Corkscrew_072613_Mike_RETOUCHED/gg_3110200_2_V3_Final.tif

不幸的是,我提供的路径没有被适当地转义,而且我在python中正确转义时遇到了麻烦。也许python不是最好的工具,但我喜欢它的灵活性 - 它可以让我扩展我写的任何东西

使用正则表达式转义函数会转义太多字符,pipes.quote方法不会转义空格,如果我使用正则表达式将''替换为'''我最终得到

/Volumes/Live_Jobs/Live_Jobs/*SCANS\\ and\\ LE\\ Docs/_LE_PROOFS_DOCS/JEM_lj/JEM/0002_OXO_CorkScrew/3\\ Delivery/GG_Double\\ Lever\\ Waiters\\ Corkscrew_072613_Mike_RETOUCHED/gg_3110200_2_V3_Final.tif

是双重转义的,不会传递给像os.path.getsize()这样的python函数。

我做错了什么?

2 个答案:

答案 0 :(得分:7)

如果您正在读取文件中的路径,并将它们传递给os.path.getsize等函数,则无需转义它们。例如:

>>> with open('name with spaces', 'w') as f:
...     f.write('abc\n')
>>> os.path.getsize('name with spaces')
4

事实上,Python中只有少数函数需要空间转义,因为它们将字符串传递给shell(如os.system),或者因为它们试图像shell一样代表您进行解析(例如subprocess.foo使用arg字符串而不是arg列表。)


所以,让我们说logfile.txt看起来像这样:

/Volumes/My Drive/My Scans/Batch 1/foo bar.tif
/Volumes/My Drive/My Scans/Batch 1/spam eggs.tif
/Volumes/My Drive/My Scans/Batch 2/another long name.tif

...然后这样的事情会正常工作:

with open('logfile.txt') as logf:
    for line in logf:
        with open(line.rstrip()) as f:
            do_something_with_tiff_file(f)

注意到示例中的*个字符,如果这些是glob模式,那也没关系:

with open('logfile.txt') as logf:
    for line in logf:
        for path in glob.glob(line.rstrip()):
            with open(path) as f:
                do_something_with_tiff_file(f)

如果您的问题与您描述的问题完全相反,并且文件中包含 转义的字符串,并且您想要忽略它们,decode('string_escape')将撤消Python样式逃避,并有不同的功能来撤消不同类型的转义,但不知道你想撤消什么样的转义很难说你想要哪个功能......

答案 1 :(得分:3)

试试这个:

  myfile = open(r'c:\tmp\junkpythonfile','w')

'r'代表原始字符串。

你也可以使用\ like

myfile = open('c:\\tmp\\junkpythonfile','w')