Question

让我们说，我有一个字符串：

  > my_string = '{foo}/{bar}'
  > my_string.format(foo='foo', bar='bar')
  'foo/bar'

对，很酷。但就我而言，我想检索my_string中哪些是关键字参数。我做了：

 > ATTRS_PATTERN = re.compile(r'{(?P<variable>[_a-z][_a-z0-9]*)}')
 > ATTRS_PATTERN.findall(my_string)
 ['foo', 'bar']

它不是很性感。你有更好的主意吗？

Answer 1

为什么重新发明轮子？ string.Formatter具有parse()功能。

>>> import string
>>> [a[1] for a in string.Formatter().parse('{foo}/{bar}')]
['foo', 'bar']

Answer 2

您可以使用string.Formatter.parse方法。它将字符串拆分为文字文本组件和字段：

In [1]: import string

In [2]: formatter = string.Formatter()

In [3]: text = 'Here is some text with {replacement} fields {}'

In [4]: list(formatter.parse(text))
Out[4]: 
[('Here is some text with ', 'replacement', '', None),
 (' fields ', '', '', None)]

要检索名称字段，只需遍历结果并收集第二个字段。

请注意，这也包括位置（编号和未编号）参数。

请注意，不包含嵌套参数：

In [1]: import string

In [2]: formatter = string.Formatter()

In [3]: list(formatter.parse('{hello:{world}}'))
Out[3]: [('', 'hello', '{world}', None)]

如果你想获得所有命名字段（假设只使用了命名字段），你必须解析元组中的第二个元素：

In [4]: def get_named_fields(text):
   ...:     formatter = string.Formatter()
   ...:     elems = formatter.parse(text)
   ...:     for _, field, spec, _ in elems:
   ...:         if field:
   ...:             yield field
   ...:         if spec:
   ...:             yield from get_named_fields(spec)
   ...:             

In [5]: list(get_named_fields('{hello:{world}}'))
Out[5]: ['hello', 'world']

（此解决方案允许任意深度格式说明符，而只有一个级别就足够了。）

如何从python中的字符串中检索关键字参数？

2 个答案: