如何在python中从命令行接收正则表达式

时间:2012-10-20 14:09:52

标签: python regex command-line-arguments

我想从命令行接收类似'\ t'(tab)的分隔符, 并用它来解析文本文件。

如果我把

delimiter = sys.argv[1]
代码中的

,并从命令行输入

$ python mycode.py "\t"

分隔符是'\\t',即python按原样保留输入字符串。

我想将其转换为'\ t',以便我可以使用例如,

'a\tb\tc'.split(delimiter)

获取['a','b','c']

我试图将'\'转换为'\',但失败了。

是否有内置的python函数来从命令行处理正则表达式?

2 个答案:

答案 0 :(得分:3)

在Python 2中,您可以使用str.decode('string_escape')

>>> '\\t'.decode('string_escape')
'\t'

在Python 3中,您必须先将字符串编码为字节,然后使用unicode_escape

>>> '\\t'.encode().decode('unicode_escape')
'\t'

两个解决方案都接受任何转义序列并正确解码它们,所以你甚至可以使用一些奇特的unicode东西:

>>> '\\t\\n\\u2665'.encode().decode('unicode_escape')
'\t\n♥'

答案 1 :(得分:0)

这不是你想要的正则表达式,它是逃避序列。

可以使用eval,只要您完全了解可怕的安全后果,或者使用自己的字符串替换/正则表达式转义序列unescaper。

(谁知道,也许arg = arg.replace("\\t", "\t")对你来说已经足够了?)

作为一种解决方法,你可以做到

$ python mycode.py `echo -ne '\t'`

到(ab)使用Unix echo命令为你做unescaping。