pandas dataframe循环遍历行

时间:2016-03-15 03:53:18

标签: python

我有一个6000 * 5 dataframe,就像:

 0      1      2     3     4
 0.001  0.020  0.502 0.773  0.332
 0.021  0.120  0.202 0.113  0.000
 0.001  0.420  0.432 0.003  0.123 ...

现在我想遍历这6000行中的每一行并比较同一行中的值,以获得新数据帧中的最大元素和存储列索引。比方说,对于第一行,最大元素应该是0.773,第二行应该是0.202,第三行应该是0.432。所以我需要一个新的dataframe喜欢

3 2 2
...

如何处理这个问题?

1 个答案:

答案 0 :(得分:0)

您可以使用如下所示的idxmax()。

df['max_col'] = df.idxmax(axis=1)
  

DataFrame.idxmax(axis = 0,skipna = True)

     

返回请求轴上第一次出现最大值的索引。   NA / null值被排除在外。

     

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.idxmax.html