Kaggle文件摘要错误(Santander价值预测挑战)

时间:2018-06-27 09:50:08

标签: pandas csv dataframe error-handling kaggle

获取提交错误:

ERROR: The value '7.63E+15' in the key column 'ID' has already been defined (Line 23029, Column 1).

链接到挑战:https://www.kaggle.com/c/santander-value-prediction-challenge

提交文件的标题:

          ID         target
0      000137c73  5.944923e+06
1      00021489f  5.944923e+06
2      0004d7953  5.944923e+06
3      00056a333  5.944923e+06
4      00056d8eb  5.944923e+06

1 个答案:

答案 0 :(得分:0)

我想您已经使用了excel或LibreOffice Calc。在excel中打开文件以查看输出将折叠您的格式。通常,最好的办法是完全避免使用Excel。您在使用Python吗?最简单的方法是加载示例提交,替换目标列并保存:

ss = pd.read_csv('sample_submission.csv')
ss.loc[:, 'target'] = preds

ss.to_csv('sub.csv',
      index=False)