我有一个技能数据框以及该技能出现在个人简历中的次数。我正在尝试按照技能出现的次数对该数据框进行排序,但是当我使用pd.sort_values时,我得到的数据框是乱序的。
-5.123450
5.123450
我得到的排序后的数据帧看起来像这样:
if (!str.trim().length) {
console.log("str is empty!");
}
很显然986应该高于99,但这在整个数据帧中都在大量发生。有人知道这是怎么回事吗?
答案 0 :(得分:0)
问题是当您在numpy数组中混合使用list1和list 2时,它将总列的数据类型更改为string,无法正确排序。解决方法是将total列转换为int然后排序。
(
new_df.assign(total=new_df.total.astype(int))
.sort_values(by='total', ascending=False, inplace=False)
)
skill total
0 business process improvement 996
2 microsoft access 992
3 pattern recognition 986
1 usability testing 99