Question

我有一个6000 * 5 dataframe，就像：

 0      1      2     3     4
 0.001  0.020  0.502 0.773  0.332
 0.021  0.120  0.202 0.113  0.000
 0.001  0.420  0.432 0.003  0.123 ...

现在我想遍历这6000行中的每一行并比较同一行中的值，以获得新数据帧中的最大元素和存储列索引。比方说，对于第一行，最大元素应该是0.773，第二行应该是0.202，第三行应该是0.432。所以我需要一个新的dataframe喜欢

3 2 2
...

如何处理这个问题？

Answer 1

您可以使用如下所示的idxmax（）。

df['max_col'] = df.idxmax(axis=1)

DataFrame.idxmax（axis = 0，skipna = True）

返回请求轴上第一次出现最大值的索引。   NA / null值被排除在外。

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.idxmax.html

pandas dataframe循环遍历行

1 个答案: