如何打印YAML字符串的特定部分

时间:2019-09-24 16:13:55

标签: python yaml pyyaml

我的YAML数据库:

left:
  - title: Active Indicative
    fill: "#cb202c"
    groups:
      - "Present | dūc[ō] | dūc[is] | dūc[it] | dūc[imus] | dūc[itis] | dūc[unt]"

我的Python代码:

import io
import yaml

with open("C:/Users/colin/Desktop/LBot/latin3_2.yaml", 'r', encoding="utf8") as f:
    doc = yaml.safe_load(f)
txt = doc["left"][1]["groups"][1]
print(txt)

当前我的输出为Present | dūc[ō] | dūc[is] | dūc[it] | dūc[imus] | dūc[itis] | dūc[unt],但我希望输出为ōisitimus。在PyYaml中有可能吗?如果可以,我将如何实现呢?预先感谢。

1 个答案:

答案 0 :(得分:1)

我没有PyYaml解决方案,但是如果您已经拥有YAML文件中的字符串,则可以使用Python的regex模块来提取[ ]内部的文本。

import re

txt = "Present | dūc[ō] | dūc[is] | dūc[it] | dūc[imus] | dūc[itis] | dūc[unt]"

parts = txt.split(" | ")
print(parts)  
# ['Present', 'dūc[ō]', 'dūc[is]', 'dūc[it]', 'dūc[imus]', 'dūc[itis]', 'dūc[unt]']

pattern = re.compile("\\[(.*?)\\]")
output = []
for part in parts:
    match = pattern.search(part)
    if match:
        # group(0) is the matched part, ex. [ō]
        # group(1) is the text inside the (.*?), ex. ō
        output.append(match.group(1))
    else:
        output.append(part)

print(" | ".join(output))
# Present | ō | is | it | imus | itis | unt

代码首先将文本分成多个部分,然后遍历每个部分search,以找到模式[x]。如果找到它,它将从match object中提取括号内的文本,并将其存储在列表中。如果part与模式(例如'Present')不匹配,则会按原样添加它。

最后,将所有提取的字符串join组合在一起,以重新构建不带括号的字符串。


根据{{​​3}}进行

EDIT

如果您只需要[ ]内的一个字符串,则可以使用相同的正则表达式模式,但可以在整个txt上使用comment方法,这将返回一个{ {1}}匹配字符串的顺序与找到它们的顺序相同

list

然后只需要使用一些变量从列表中选择一项即可。

import re

txt = "Present | dūc[ō] | dūc[is] | dūc[it] | dūc[imus] | dūc[itis] | dūc[unt]"

pattern = re.compile("\\[(.*?)\\]")
matches = pattern.findall(txt)
print(matches) 
# ['ō', 'is', 'it', 'imus', 'itis', 'unt']