在比较变量时,Pandas缩放为类别未返回预期结果

时间:2017-10-27 09:19:33

标签: python pandas scale categories boolean-logic

我正在做一些课程,其中一个我必须使用pandas astype函数来对数据框中的某些值进行分类。作为练习的一部分,我必须比较成绩以查看astype函数是否确实将它们整理好,给定的练习有效,但我后来开发的练习不适用。以下是代码:
工作代码

import pandas as pd
import numpy as np
df = pd.DataFrame(['A+', 'A', 'A-', 'B+', 'B', 'B-', 'C+', 'C', 'C-', 'D+', 'D'],
                  index=['excellent', 'excellent', 'excellent', 'good', 'good', 'good', 'ok', 'ok', 'ok', 'poor', 'poor'])
df.rename(columns={0: 'Grades'}, inplace=True)
grades = df['Grades'].astype('category',
                         categories=['D', 'D+', 'C-', 'C', 'C+', 'B-', 'B', 'B+', 'A-', 'A', 'A+'],
                         ordered=True)
grades > 'C'


返回:

excellent     True
excellent     True
excellent     True
good          True
good          True
good          True
ok            True
ok           False
ok           False
poor         False
poor         False
Name: Grades, dtype: bool


我的代码

s = pd.Series(['Low', 'Low', 'High', 'Medium', 'Low', 'High', 'Low'])
s.astype('category', categories=['Low', 'Medium', 'High'], ordered=True)
s>'Low'


返回:

0    False
1    False
2    False
3     True
4    False
5    False
6    False
dtype: bool



正如您在'High'>'Low'进行比较时所看到的那样,它会返回'False'。难道我做错了什么?我失去了任何概念吗?谢谢。

1 个答案:

答案 0 :(得分:0)

你忘了分配输出:

print (s > 'Low')
0    False
1    False
2    False
3     True
4    False
5    False
6    False
dtype: bool

s = s.astype('category', categories=['Low', 'Medium', 'High'], ordered=True)

print (s > 'Low')
0    False
1    False
2     True
3     True
4    False
5     True
6    False
dtype: bool