我有一个看起来像这样的csv:
Students | Math | Reading
Tom | 80 | 75
Mike | 65 | 90
我想导入此csv并确定哪个Student
在Math
和Reading
得分之间的差异最大。
在这个例子中。我希望Mike
成为结果,因为他的差异是25
,而汤姆的差异是15
。
答案 0 :(得分:4)
您希望Student
成为数据帧的索引。根据您提供的示例数据,我会像这样导入它。
df = pd.read_csv('test.csv', sep='\s*\|\s*', engine='python', index_col=0)
当列看到零个或多个空格后跟一个垂直条后跟零个或多个空格时,这将分隔列。它还会将索引设为Students
列
现在,您可以使用它来查找Student
和Math
得分之间绝对差异最大的Reading
。
df.Math.sub(df.Reading).abs().idxmax()
'Mike'