我是这里的新手,所以如有任何错误,请原谅。我正在尝试使用Hdfc银行数据集。我发现很难删除数据集中的问号。 我面临着对此数据集进行分析的困难。我正在尝试请帮助我
我正在尝试this code,但是却显示错误,我该如何解决?请帮助我。
答案 0 :(得分:0)
我无法运行您的笔记本,因为我无权访问数据,但看起来您的列是字符串(运行bad_flag
时只有describe()
显示输出)。您有两种选择:
1)将列中的?
替换为np.nan
。例如,您可以在一列中尝试(如果可行,将其应用于整个数据框):
ag_train['V3_replaced'] = ag_train.V3.replace('?', np.nan)
2)将列转换为数字,并强制'?'到np.nan
,就像这样:
ag_train['V3_converted'] = pd.to_numeric(ag_train.V3, errors='coerce')