熊猫和功能

时间:2019-10-18 16:07:04

标签: pandas

enter image description here

^^^^^

这是我在print(final_train.income)上得到的输出,其中final_train是我的数据帧。

LTE50 =(final_train.income =='<= 50K')。sum()

出于某种原因,当我实际看到列收入包含<= 50K时,LTE50始终为0。 任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

该代码应该起作用。我想那里还有其他空白字符,例如空格。根据该列中除“ <= 50K”以外的内容,我将尝试剥离该列的空格。

#  Creates a new column
final_train['strippedincome'] = final_train.income.str.strip()  
LTE50 = (final_train.strippedincome == '<=50K').sum()

#  Strips existing column in place
final_train['income'] = final_train.income.str.strip()  
LTE50 = (final_train.income == '<=50K').sum()