我对熊猫还很陌生(使用第三方代码,被迫使用它!),并且有一个数据框,看起来像这样:
name_id cookie_id file_name_id
John 56 /some/loc
Doe 45 /some/loc2
John 67 /some/loc3
hilary 768 /some/loc4
wendy 8 /some/loc3
hilary 4 /some/loc4
我想按name_id
对它们进行排序,如下所示:
name_id cookie_id file_name_id
Doe 45 /some/loc2
John 56 /some/loc
John 67 /some/loc3
hilary 768 /some/loc4
hilary 4 /some/loc4
wendy 8 /some/loc3
我正在查看:
df.sort_values(by=['name_id'])
它似乎确实给了我正确的答案,但是由于我是熊猫的新手,所以我恐怕可能需要了解一些陷阱。
答案 0 :(得分:1)
df.sort_values(by=['name_id'])
应该很好用。请注意name_id
字符串开头的空格,因为这些空格将首先排序。例如,在您的案例中," wendy"
会放在顶部。