Question

我有一个看起来像这样的csv：

Students | Math | Reading
Tom | 80 | 75
Mike | 65 | 90

我想导入此csv并确定哪个Student在Math和Reading得分之间的差异最大。

在这个例子中。我希望Mike成为结果，因为他的差异是25，而汤姆的差异是15。

Answer 1

您希望Student成为数据帧的索引。根据您提供的示例数据，我会像这样导入它。

df = pd.read_csv('test.csv', sep='\s*\|\s*', engine='python', index_col=0)

当列看到零个或多个空格后跟一个垂直条后跟零个或多个空格时，这将分隔列。它还会将索引设为Students列

现在，您可以使用它来查找Student和Math得分之间绝对差异最大的Reading。

df.Math.sub(df.Reading).abs().idxmax()

'Mike'