我正在尝试使用以下内容将一堆表示为字符串的日期读入数据框中:
import pandas as pd
TIMESTAMP_KEY = 'Date'
TIMESTAMP_FORMAT = '%Y-%m-%d'
DATE_PARSER = lambda date: pd.datetime.strptime(date, TIMESTAMP_FORMAT)
pd.read_csv('file.csv', parse_dates=[TIMESTAMP_KEY], date_parser=DATE_PARSER)
其中file.csv
包含名为Date
的列,其日期字符串的格式为%Y-%m-%d
,即2014-11-01
。
这将产生一个熊猫TimeStamp
对象,该对象会打印
2015-11-01 00:00:00
但是,我不需要时间元素。请问有一个整洁的解决方案吗?
这是唯一的方法(假设索引指向Date
列):
df.index = [index.date() for index in df.index]
...还是可以在DATE_PARSER
上指定?