从一个大型数据集中,我试图将两列导出到csv:“ row_id”和“ accepted”。 '接受的每行包含0或1。这是机器学习模型的结果。
但是,当我检查csv时,所有0都消失了。换句话说,如果我的数据中“ accepted”列的值为0,则在csv中为空。我该如何解决?
我试图像这样定义数据类型:
my_submission=pd.DataFrame({'row_id':testvalues.row_id,'accepted': solution2}).astype('str')
但是输出是相同的。
我当前的代码:
solution2=gbr.predict(testvalues1)
my_submission=pd.DataFrame({'row_id':testvalues.row_id,'accepted': solution2})
my_submission.to_csv('GradientBoosterClassifierSolution.csv', index=False)
当前结果:
row_id, accepted
0,1
1
2
3,1
4
预期结果:
row_id, accepted
0,1
1,0
2,0
3,1
4,0
答案 0 :(得分:0)
假设您的列表中没有数据,像这样将na_rep添加到您的my_submission.to_csv()
my_submission.to_csv('GradientBoosterClassifierSolution.csv', index=False, na_rep='0')
那应该用0填补所有空白