我正在阅读一个csv文件,其中有两个相邻的列包含如下日期:
29/11/2004 00:00,29/11/2005 00:00,2,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL
当我使用read_csv读取它然后使用to_csv方法将其写回csv时,它会转换为
29/11/2004 00:00,00:00.0,2.0,,,,,,,,
我有两个问题:为什么它首先看好了,但认为第二个看起来格式完全相同的是0?为什么将NULL转换为空字符串?
以下是我正在使用的代码:
df = pandas.read_csv(filepath, sep = ",")
df.to_csv("C:\\tmp\\test.csv")
答案 0 :(得分:1)
不确定错过日期的原因。我认为它受到其他行的影响。
对于NULL字符串问题,keep_default_na
可以帮助您避免这种情况:
df = pd.read_csv('test.csv', sep=',', keep_default_na=False)