使用python / pandas dataframe对csv文件进行denormalize

时间:2013-04-28 23:59:50

标签: python pandas

我有一个csv文件,结构如下:

Location Parameter

A            10
A            20
B            14
B            16
C            15
C             9
C             6

我可以使用read_csv轻松地将其传入数据帧。

我想使用python / pandas转换数据帧以获取A,B,C中的每一个的列,并通过相应的参数填充值,例如

A    B     C
10   14   15
20   16    9
NA   NA    6

最终目标是在数据框上做一个箱线图。

提前致谢。

2 个答案:

答案 0 :(得分:3)

我无法使用正确的旋转/堆叠方式 - 其他人可能会采用正确的方式 - 所以我又回到了groupby

>>> df
  Location  Parameter
0        A         10
1        A         20
2        B         14
3        B         16
4        C         15
5        C          9
6        C          6
>>> cd = {k: v.reset_index(drop=True) for k,v in df.groupby("Location")["Parameter"]}
>>> pd.DataFrame(cd)
    A   B   C
0  10  14  15
1  20  16   9
2 NaN NaN   6

答案 1 :(得分:0)

要制作一个箱形图,groupby的结果就足够了:

grouped = data.groupby('Location')
grouped.boxplot(subplots=False)