Question

我正在阅读一个csv文件，其中有两个相邻的列包含如下日期：

29/11/2004 00:00,29/11/2005 00:00,2,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL

当我使用read_csv读取它然后使用to_csv方法将其写回csv时，它会转换为

29/11/2004 00:00,00:00.0,2.0,,,,,,,,

我有两个问题：为什么它首先看好了，但认为第二个看起来格式完全相同的是0？为什么将NULL转换为空字符串？

以下是我正在使用的代码：

df = pandas.read_csv(filepath, sep = ",")
df.to_csv("C:\\tmp\\test.csv")

Answer 1

不确定错过日期的原因。我认为它受到其他行的影响。

对于NULL字符串问题，keep_default_na可以帮助您避免这种情况：

df = pd.read_csv('test.csv', sep=',', keep_default_na=False)