pandas read_csv默默地转换和搞乱日期和字符串?

时间:2013-07-16 13:52:56

标签: python pandas

我正在阅读一个csv文件,其中有两个相邻的列包含如下日期:

29/11/2004 00:00,29/11/2005 00:00,2,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL

当我使用read_csv读取它然后使用to_csv方法将其写回csv时,它会转换为

29/11/2004 00:00,00:00.0,2.0,,,,,,,,

我有两个问题:为什么它首先看好了,但认为第二个看起来格式完全相同的是0?为什么将NULL转换为空字符串?

以下是我正在使用的代码:

df = pandas.read_csv(filepath, sep = ",")
df.to_csv("C:\\tmp\\test.csv")

1 个答案:

答案 0 :(得分:1)

不确定错过日期的原因。我认为它受到其他行的影响。

对于NULL字符串问题,keep_default_na可以帮助您避免这种情况:

df = pd.read_csv('test.csv', sep=',', keep_default_na=False)