我有一个超过1000行50列的csv文件。每行都有值(即0.554562),每列都有相同类型的值:
以我的csv文件()为例:
Albany Ukraine Germany Swiss England
kevin 0.5655 0.5777 0.3232 0.1212 0.9595
brayan 0.4655 0.2777 0.1232, 0.9212 0.5595
alex 0.1655 0.2777 0.3232 0.1212 0.9795
现在,我想在每一行中找到最高的值并创建新的列并添加到其中,例如:
Albany Ukraine Germany Swiss England highest
kevin 0.5655 0.5777 0.3232 0.1212 0.9595 0.9595
brayan 0.4655 0.2777 0.1232 0.9212 0.5595 0.9212
alex 0.1655 0.2777 0.3232 0.1212 0.9795 0.9795
我已经在此处查看了几则帖子,例如1 2,但是没有一个帮助我。
如果您可以提供可以在我这边运行并学习的代码的帮助,那将非常好。谢谢
加法:还有什么办法可以说最高概率[0.9595]的凯文属于英格兰吗?
答案 0 :(得分:2)
处理axis=1
(行)并使用max
分配新列
df["highest"] = df.max(axis=1)
使用idxmax
会告诉您最大的位置
top_prob = df.idxmax(axis=1)