让我们说,我有一个字符串:
> my_string = '{foo}/{bar}'
> my_string.format(foo='foo', bar='bar')
'foo/bar'
对,很酷。但就我而言,我想检索my_string
中哪些是关键字参数。我做了:
> ATTRS_PATTERN = re.compile(r'{(?P<variable>[_a-z][_a-z0-9]*)}')
> ATTRS_PATTERN.findall(my_string)
['foo', 'bar']
它不是很性感。你有更好的主意吗?
答案 0 :(得分:5)
为什么重新发明轮子? string.Formatter
具有parse()功能。
>>> import string
>>> [a[1] for a in string.Formatter().parse('{foo}/{bar}')]
['foo', 'bar']
答案 1 :(得分:1)
您可以使用string.Formatter.parse
方法。它将字符串拆分为文字文本组件和字段:
In [1]: import string
In [2]: formatter = string.Formatter()
In [3]: text = 'Here is some text with {replacement} fields {}'
In [4]: list(formatter.parse(text))
Out[4]:
[('Here is some text with ', 'replacement', '', None),
(' fields ', '', '', None)]
要检索名称字段,只需遍历结果并收集第二个字段。
请注意,这也包括位置(编号和未编号)参数。
请注意,不包含嵌套参数:
In [1]: import string
In [2]: formatter = string.Formatter()
In [3]: list(formatter.parse('{hello:{world}}'))
Out[3]: [('', 'hello', '{world}', None)]
如果你想获得所有命名字段(假设只使用了命名字段),你必须解析元组中的第二个元素:
In [4]: def get_named_fields(text):
...: formatter = string.Formatter()
...: elems = formatter.parse(text)
...: for _, field, spec, _ in elems:
...: if field:
...: yield field
...: if spec:
...: yield from get_named_fields(spec)
...:
In [5]: list(get_named_fields('{hello:{world}}'))
Out[5]: ['hello', 'world']
(此解决方案允许任意深度格式说明符,而只有一个级别就足够了。)