按Pandas中的数据框分组,列中包含常用值

时间:2016-06-16 01:20:26

标签: python pandas

我在Pandas中有一个数据框,例如:

Col1 Col2 Col3
A    B    10/10/2016
B    A    09/12/2016
A    C    08/11/2016

我希望Col1和Col2中的每个唯一条目都能获得Col3值。问题是用户可以在Col1或Col2中,因此组合Col1将错过B-A线。

有关如何实现它的任何想法?

非常感谢提前!

1 个答案:

答案 0 :(得分:0)

你可以:

df.set_index(['Col3']).stack().reset_index(-1, drop=True)

得到:

Col3
10/10/2016    A
10/10/2016    B
09/12/2016    B
09/12/2016    A
08/11/2016    A
08/11/2016    C

您可以进一步处理,例如使用(假设上面已分配给result

result.groupby(result.values).apply(lambda x: x.index.tolist())

A    [10/10/2016, 09/12/2016, 08/11/2016]
B                [10/10/2016, 09/12/2016]
C                            [08/11/2016]

或者,您可以使用pd.melt

pd.melt(df, value_vars=['Col1', 'Col2'], id_vars='Col3')

         Col3 variable value
0  10/10/2016     Col1     A
1  09/12/2016     Col1     B
2  08/11/2016     Col1     A
3  10/10/2016     Col2     B
4  09/12/2016     Col2     A
5  08/11/2016     Col2     C

另见:

df.set_index(['Col3']).stack().reset_index()

         Col3 level_1  0
0  10/10/2016    Col1  A
1  10/10/2016    Col2  B
2  09/12/2016    Col1  B
3  09/12/2016    Col2  A
4  08/11/2016    Col1  A
5  08/11/2016    Col2  C