我有一个两列的pandas数据框。我要测量过渡计数,即每个唯一的第一列值与每个唯一的第二列值相关的次数。这应该是数据透视表或数据透视表,但我被卡住了。在粘贴的代码中,trial
是输入数据帧,而ans
是答案数据帧,我希望通过操纵trial
数据帧来看到。
我没有发现只有两列的类似数据框问题。其他人在第三个表上使用数据透视表,其中使用了平均值或总和。在这种情况下,只有两列,我想计算转换次数。其他问题还使用了可能进行汇总的数字列。我想计算非数值的列。
如果有类似的问题,请有人指出我会很有帮助。
trial=pd.DataFrame({'col1':list('AABCCCDDDD'),'col2':list('XYXXXYYXZZ')})
index col1 col2
0 A X
1 A Y
2 B X
3 C X
4 C X
5 C Y
6 D Y
7 D X
8 D Z
9 D Z
ans=pd.DataFrame({'col1':list('ABCD'),'X':[1,1,2,1],'Y':[1,0,1,1],'Z':[0,0,0,2]})
ans.set_index('col1')
col1 X Y Z
A 1 1 0
B 1 0 0
C 2 1 0
D 1 1 2