如何从python中的字符串中检索关键字参数?

时间:2014-06-12 09:18:42

标签: python string parsing format

让我们说,我有一个字符串:

  > my_string = '{foo}/{bar}'
  > my_string.format(foo='foo', bar='bar')
  'foo/bar'

对,很酷。但就我而言,我想检索my_string中哪些是关键字参数。我做了:

 > ATTRS_PATTERN = re.compile(r'{(?P<variable>[_a-z][_a-z0-9]*)}')
 > ATTRS_PATTERN.findall(my_string)
 ['foo', 'bar']

它不是很性感。你有更好的主意吗?

2 个答案:

答案 0 :(得分:5)

为什么重新发明轮子? string.Formatter具有parse()功能。

>>> import string
>>> [a[1] for a in string.Formatter().parse('{foo}/{bar}')]
['foo', 'bar']

答案 1 :(得分:1)

您可以使用string.Formatter.parse方法。它将字符串拆分为文字文本组件和字段:

In [1]: import string

In [2]: formatter = string.Formatter()

In [3]: text = 'Here is some text with {replacement} fields {}'

In [4]: list(formatter.parse(text))
Out[4]: 
[('Here is some text with ', 'replacement', '', None),
 (' fields ', '', '', None)]

要检索名称字段,只需遍历结果并收集第二个字段。

请注意,这也包括位置(编号和未编号)参数。

请注意,包含嵌套参数:

In [1]: import string

In [2]: formatter = string.Formatter()

In [3]: list(formatter.parse('{hello:{world}}'))
Out[3]: [('', 'hello', '{world}', None)]

如果你想获得所有命名字段(假设只使用了命名字段),你必须解析元组中的第二个元素:

In [4]: def get_named_fields(text):
   ...:     formatter = string.Formatter()
   ...:     elems = formatter.parse(text)
   ...:     for _, field, spec, _ in elems:
   ...:         if field:
   ...:             yield field
   ...:         if spec:
   ...:             yield from get_named_fields(spec)
   ...:             

In [5]: list(get_named_fields('{hello:{world}}'))
Out[5]: ['hello', 'world']

(此解决方案允许任意深度格式说明符,而只有一个级别就足够了。)