Question

我正在使用Pandas的read_csv方法在Python中读取一个巨大的csv文件。我有一个列具有格式为YYYY-MM-DD HH:MM:SS的日期和时间（在同一列中）。我是数据的第0列。目前我在做的是：

    format = "%Y-%m-%d %H:%M:%S"
    parser = lambda x: pd.datetime.strptime(x, format)
    data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser)

但它告诉我在导入时使用指定dtype选项。我尝试在调用中添加一个参数：dtype = {[0]:pandas.datetime}但它没有用。你有更好的解决方法吗？或者有人可以解释如何正确使用dtype参数？我尝试阅读文档，但没有多大帮助。

Answer 1

也许您可以在阅读文件后尝试格式化列

data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1')

data[0] = pd.to_datetime(data[0], format= "%Y-%m-%d %H:%M:%S")

希望它有所帮助。

使用pandas读取csv文件python 3.6

1 个答案: