两列DataFrame到过渡表(数据透视表)

时间:2019-07-15 10:50:37

标签: python pandas dataframe pivot

我有一个两列的pandas数据框。我要测量过渡计数,即每个唯一的第一列值与每个唯一的第二列值相关的次数。这应该是数据透视表或数据透视表,但我被卡住了。在粘贴的代码中,trial是输入数据帧,而ans是答案数据帧,我希望通过操纵trial数据帧来看到。

我没有发现只有两列的类似数据框问题。其他人在第三个表上使用数据透视表,其中使用了平均值或总和。在这种情况下,只有两列,我想计算转换次数。其他问题还使用了可能进行汇总的数字列。我想计算非数值的列。

如果有类似的问题,请有人指出我会很有帮助。

trial=pd.DataFrame({'col1':list('AABCCCDDDD'),'col2':list('XYXXXYYXZZ')})
index  col1  col2

 0      A       X

 1      A       Y

 2      B       X

 3      C       X

 4      C       X

 5      C       Y

 6      D       Y

 7      D       X

 8      D       Z

 9      D       Z
ans=pd.DataFrame({'col1':list('ABCD'),'X':[1,1,2,1],'Y':[1,0,1,1],'Z':[0,0,0,2]})
ans.set_index('col1')
col1      X  Y  Z

  A       1  1  0

  B       1  0  0

  C       2  1  0

  D       1  1  2

0 个答案:

没有答案