我有一个6000 * 5 dataframe
,就像:
0 1 2 3 4
0.001 0.020 0.502 0.773 0.332
0.021 0.120 0.202 0.113 0.000
0.001 0.420 0.432 0.003 0.123 ...
现在我想遍历这6000行中的每一行并比较同一行中的值,以获得新数据帧中的最大元素和存储列索引。比方说,对于第一行,最大元素应该是0.773,第二行应该是0.202,第三行应该是0.432。所以我需要一个新的dataframe
喜欢
3 2 2
...
如何处理这个问题?
答案 0 :(得分:0)
您可以使用如下所示的idxmax()。
df['max_col'] = df.idxmax(axis=1)
DataFrame.idxmax(axis = 0,skipna = True)
返回请求轴上第一次出现最大值的索引。 NA / null值被排除在外。
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.idxmax.html