熊猫sort_values返回排序错误的数据框

时间:2019-08-19 23:24:09

标签: python-3.x pandas dataframe

我有一个技能数据框以及该技能出现在个人简历中的次数。我正在尝试按照技能出现的次数对该数据框进行排序,但是当我使用pd.sort_values时,我得到的数据框是乱序的。

-5.123450
5.123450

我得到的排序后的数据帧看起来像这样:

if (!str.trim().length) {
    console.log("str is empty!");
}

很显然986应该高于99,但这在整个数据帧中都在大量发生。有人知道这是怎么回事吗?

1 个答案:

答案 0 :(得分:0)

问题是当您在numpy数组中混合使用list1和list 2时,它将总列的数据类型更改为string,无法正确排序。解决方法是将total列转换为int然后排序。

(
    new_df.assign(total=new_df.total.astype(int))
    .sort_values(by='total', ascending=False, inplace=False)
)

    skill                           total
0   business process improvement    996
2   microsoft access                992
3   pattern recognition             986
1   usability testing               99
相关问题