我在Pandas中有一个数据框,例如:
Col1 Col2 Col3
A B 10/10/2016
B A 09/12/2016
A C 08/11/2016
我希望Col1和Col2中的每个唯一条目都能获得Col3值。问题是用户可以在Col1或Col2中,因此组合Col1将错过B-A线。
有关如何实现它的任何想法?
非常感谢提前!
答案 0 :(得分:0)
你可以:
df.set_index(['Col3']).stack().reset_index(-1, drop=True)
得到:
Col3
10/10/2016 A
10/10/2016 B
09/12/2016 B
09/12/2016 A
08/11/2016 A
08/11/2016 C
您可以进一步处理,例如使用(假设上面已分配给result
:
result.groupby(result.values).apply(lambda x: x.index.tolist())
A [10/10/2016, 09/12/2016, 08/11/2016]
B [10/10/2016, 09/12/2016]
C [08/11/2016]
或者,您可以使用pd.melt
:
pd.melt(df, value_vars=['Col1', 'Col2'], id_vars='Col3')
Col3 variable value
0 10/10/2016 Col1 A
1 09/12/2016 Col1 B
2 08/11/2016 Col1 A
3 10/10/2016 Col2 B
4 09/12/2016 Col2 A
5 08/11/2016 Col2 C
另见:
df.set_index(['Col3']).stack().reset_index()
Col3 level_1 0
0 10/10/2016 Col1 A
1 10/10/2016 Col2 B
2 09/12/2016 Col1 B
3 09/12/2016 Col2 A
4 08/11/2016 Col1 A
5 08/11/2016 Col2 C