我有一个csv文件,结构如下:
Location Parameter
A 10
A 20
B 14
B 16
C 15
C 9
C 6
我可以使用read_csv轻松地将其传入数据帧。
我想使用python / pandas转换数据帧以获取A,B,C中的每一个的列,并通过相应的参数填充值,例如
A B C
10 14 15
20 16 9
NA NA 6
最终目标是在数据框上做一个箱线图。
提前致谢。
答案 0 :(得分:3)
我无法使用正确的旋转/堆叠方式 - 其他人可能会采用正确的方式 - 所以我又回到了groupby
:
>>> df
Location Parameter
0 A 10
1 A 20
2 B 14
3 B 16
4 C 15
5 C 9
6 C 6
>>> cd = {k: v.reset_index(drop=True) for k,v in df.groupby("Location")["Parameter"]}
>>> pd.DataFrame(cd)
A B C
0 10 14 15
1 20 16 9
2 NaN NaN 6
答案 1 :(得分:0)
要制作一个箱形图,groupby的结果就足够了:
grouped = data.groupby('Location')
grouped.boxplot(subplots=False)