我有一个像这样的数据集:{'IT',[1,20,35,44,51,....,1000]} 我想将其转换为python / pandas数据框。我想以以下格式查看输出。如何实现此输出。
Dept Count
IT 1
IT 20
IT 35
IT 44
IT 51
.. .
.. .
.. .
IT 1000
下面是我可以写的方法,但这不是处理大量数据的有效方法。
data = [['IT',1],['IT',2],['IT',3]]
df = pd.DataFrame(data,columns=['Dept','Count'])
print(df)
答案 0 :(得分:3)
不需要列表理解,因为pandas
会自动为每一行填充IT。
import pandas as pd
d = {'IT':[1,20,35,44,51,1000]}
df = pd.DataFrame({'dept': 'IT', 'count': d['IT']})
答案 1 :(得分:2)
对元组使用列表理解,并传递给DataFrame
构造函数:
d = {'IT':[1,20,35,44,51], 'NEW':[1000]}
data = [(k, x) for k, v in d.items() for x in v]
df = pd.DataFrame(data,columns=['Dept','Count'])
print(df)
Dept Count
0 IT 1
1 IT 20
2 IT 35
3 IT 44
4 IT 51
5 NEW 1000
答案 2 :(得分:1)
您可以使用melt
import pandas as pd
d = {'IT': [10]*100000}
df = pd.DataFrame(d)
df = pd.melt(df, var_name='Dept', value_name='Count')