我想从命令行接收类似'\ t'(tab)的分隔符, 并用它来解析文本文件。
如果我把
delimiter = sys.argv[1]
代码中的,并从命令行输入
$ python mycode.py "\t"
分隔符是'\\t'
,即python按原样保留输入字符串。
我想将其转换为'\ t',以便我可以使用例如,
'a\tb\tc'.split(delimiter)
获取['a','b','c']
。
我试图将'\'转换为'\',但失败了。
是否有内置的python函数来从命令行处理正则表达式?
答案 0 :(得分:3)
在Python 2中,您可以使用str.decode('string_escape')
:
>>> '\\t'.decode('string_escape')
'\t'
在Python 3中,您必须先将字符串编码为字节,然后使用unicode_escape
:
>>> '\\t'.encode().decode('unicode_escape')
'\t'
两个解决方案都接受任何转义序列并正确解码它们,所以你甚至可以使用一些奇特的unicode东西:
>>> '\\t\\n\\u2665'.encode().decode('unicode_escape')
'\t\n♥'
答案 1 :(得分:0)
这不是你想要的正则表达式,它是逃避序列。
你可以使用eval
,只要您完全了解可怕的安全后果,或者使用自己的字符串替换/正则表达式转义序列unescaper。
(谁知道,也许arg = arg.replace("\\t", "\t")
对你来说已经足够了?)
作为一种解决方法,你可以做到
$ python mycode.py `echo -ne '\t'`
到(ab)使用Unix echo命令为你做unescaping。