所以,我发现其他堆栈溢出代码来获取字段,这就是我对我的典型.yaml看起来像这样
- id:
bioguide: B000226
govtrack: 401222
icpsr: 507
name:
first: Richard
last: Bassett
bio:
birthday: '1745-04-02'
gender: M
terms:
- type: sen
start: '1789-03-04'
end: '1793-03-02'
state: DE
class: 2
party: Anti-Administration
我有大约12000个我想要解析的,一旦我理解了它只是让它运行的问题。现在我只是想做一些简单的事情,比如在文件中获取一个人的名字,所以我试过这个
for filename in os.listdir(currentPath):
print filename
if(filename.endswith(".yaml")):
with open(os.path.join(currentPath, filename)) as myFile:
results = yaml.load(myFile)
try:
print results["name"]["first"]
except:
print "Problem"
如果我不尝试捕获异常我得到这个问题,我不知道为什么因为不是一个yaml文件像json文件的字典?似乎它将我解释为将其用作列表。
print results["name"]["first"]
TypeError: list indices must be integers, not str
我遗漏了一些基本的东西,这是我唯一的障碍就是从yaml获取数据,一些见解会很受欢迎
编辑:
当我打印12000的其中一个文件时,它采用这种格式
[{'bio': {'gender': 'M', 'birthday': '1914-06-09'}, 'terms': [{'start': '1963-01-09', 'state': 'CA', 'end': '1964-10-03', 'district': 34, 'party': 'Democrat', 'type': 'rep'}, {'start': '1965-01-04', 'state': 'CA', 'end': '1966-10-22', 'district': 34, 'party': 'Democrat', 'type': 'rep'}, {'start': '1967-01-10', 'state': 'CA', 'end': '1968-10-14', 'district': 34, 'party': 'Democrat', 'type': 'rep'}, {'start': '1969-01-03', 'state': 'CA', 'end': '1971-01-02', 'district': 34, 'party': 'Democrat', 'type': 'rep'}, {'start': '1971-01-21', 'state': 'CA', 'end': '1972-10-18', 'district': 34, 'party': 'Democrat', 'type': 'rep'}, {'start': '1973-01-03', 'state': 'CA', 'end': '1974-12-20', 'district': 34, 'party': 'Democrat', 'type': 'rep'}], 'id': {'bioguide': 'H000164', 'icpsr': 10594, 'house_history': 14486, 'wikipedia': 'Richard T. Hanna', 'thomas': '00494', 'govtrack': 405046}, 'name': {'middle': 'Thomas', 'last': 'Hanna', 'first': 'Richard'}}]
如果你可以帮助我,并告诉我如何访问一些非常有用的名称,开始结束日期等内容。
答案 0 :(得分:1)
这会有用吗?
try:
print results[0]['name']['first']
except:
print 'Problem'