Question

从一个大型数据集中，我试图将两列导出到csv：“ row_id”和“ accepted”。 '接受的每行包含0或1。这是机器学习模型的结果。

但是，当我检查csv时，所有0都消失了。换句话说，如果我的数据中“ accepted”列的值为0，则在csv中为空。我该如何解决？

我试图像这样定义数据类型：

my_submission=pd.DataFrame({'row_id':testvalues.row_id,'accepted': solution2}).astype('str')

但是输出是相同的。

我当前的代码：

solution2=gbr.predict(testvalues1)
my_submission=pd.DataFrame({'row_id':testvalues.row_id,'accepted': solution2})
my_submission.to_csv('GradientBoosterClassifierSolution.csv', index=False)

当前结果：

row_id, accepted
0,1
1
2
3,1
4

预期结果：

row_id, accepted
0,1
1,0
2,0
3,1
4,0

Answer 1

假设您的列表中没有数据，像这样将na_rep添加到您的my_submission.to_csv()

my_submission.to_csv('GradientBoosterClassifierSolution.csv', index=False, na_rep='0')

那应该用0填补所有空白

将包含零的列导出到csv

1 个答案: