我正在使用Pandas的read_csv方法在Python中读取一个巨大的csv文件。我有一个列具有格式为YYYY-MM-DD HH:MM:SS
的日期和时间(在同一列中)。我是数据的第0列。目前我在做的是:
format = "%Y-%m-%d %H:%M:%S"
parser = lambda x: pd.datetime.strptime(x, format)
data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser)
但它告诉我在导入时使用指定dtype选项。我尝试在调用中添加一个参数:dtype = {[0]:pandas.datetime}
但它没有用。你有更好的解决方法吗?或者有人可以解释如何正确使用dtype参数?我尝试阅读文档,但没有多大帮助。
答案 0 :(得分:0)
也许您可以在阅读文件后尝试格式化列
data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1')
data[0] = pd.to_datetime(data[0], format= "%Y-%m-%d %H:%M:%S")
希望它有所帮助。