我有很多字典。每个Dict都有5个键/值对。
示例词典
{
'name': 'Demetrius',
'number': '0001',
'style': 'D',
'text': 'Demetrius an der russischen Grenze. Er ist von Kiew...',
'year': '1797'
}
我的目标:
我的目标是一个具有以下顺序的数据框。每个Dict都有自己的行
>>> df
number name year style text
0001 Demetrius 1805 D Demetrius an der russischen Grenze. Er ist von Kiew...
0002
代码:
d =文本文件的内容-字典列表,
book =像示例字典一样的字典
>>>import pandas as pd
>>>df = pd.DataFrame()
>>>for book in d:
>>> df = pd.concat([df, pd.DataFrame(list(book.items()))])
>>>print(df)
0 1
0 name Demetrius
1 number 0001
2 style D
3 text Demetrius an der russischen Grenze. Er ist von Kiew...
4 year 1805
0 name Der versöhnte Menschenfeind
1 number 0002
2 style D
3 text Der versöhnte Menschenfeind - Fragment Gegend...
4 year 1790
...
问题:
如何直接实现数据框的样式(我的目标),或者如何更改以dict.keys,列和“数字”键中的值作为索引的现有df?>
解决方案:-感谢jpp
>>> df = pd.DataFrame(d).set_index('number')
>>> df
name style text year
number
0001 Demetrius D Demetrius an der russischen Grenze Er ist vo... 1805
0002 Der versöhnte Menschenfeind D Der versöhnte Menschenfeind - Fragment Gegend... 1790
答案 0 :(得分:1)
pd.DataFrame
构造函数直接接受字典列表。这将比重复附加到现有数据帧更有效。这是一个演示:
d1 = {'name': 'Demetrius', 'number': '0001',
'style': 'D', 'text': 'Demetrius an der...',
'year': '1797'}
d2 = {'name': 'ABC', 'number': '0002',
'style': 'E', 'text': 'Some text',
'year': '1850'}
L = [d1, d2]
df = pd.DataFrame(L)
print(df)
name number style text year
0 Demetrius 0001 D Demetrius an der... 1797
1 ABC 0002 E Some text 1850