^^^^^
这是我在print(final_train.income)上得到的输出,其中final_train是我的数据帧。
LTE50 =(final_train.income =='<= 50K')。sum()
出于某种原因,当我实际看到列收入包含<= 50K时,LTE50始终为0。 任何帮助将不胜感激。
答案 0 :(得分:0)
该代码应该起作用。我想那里还有其他空白字符,例如空格。根据该列中除“ <= 50K”以外的内容,我将尝试剥离该列的空格。
# Creates a new column
final_train['strippedincome'] = final_train.income.str.strip()
LTE50 = (final_train.strippedincome == '<=50K').sum()
或
# Strips existing column in place
final_train['income'] = final_train.income.str.strip()
LTE50 = (final_train.income == '<=50K').sum()