说我正在查看发现here的Rdataset acme.csv。如何以适当粗略的日期导入它?使用parse_dates,它指定当天(今天是7月18日)的日期,因为没有指定日期。我可以像月份一样处理月份/年份,但继续使用PANDAS的日期功能吗?
import pandas as pd
url = 'http://vincentarelbundock.github.io/Rdatasets/csv/boot/acme.csv'
df = pd.read_csv(url, parse_dates=[1])
df.drop('Unnamed: 0', axis=1, inplace=True)
答案 0 :(得分:2)
不要在read_csv()
中解析日期,而是在to_datetime
format
df['month'] = pd.to_datetime(df['month'], format='%m/%y')
或者您可以使用lambda
在read_csv()
中使用该功能
df = pd.read_csv(url, parse_dates=['month'], date_parser=lambda x:pd.to_datetime(x, format='%m/%y'))
但是你总是在datetime
获得一些天数。
顺便说一句:datetime
time
你也总是print df['month'].head()
print df['month'].apply(lambda x:x.time()).head()
,但有时大熊猫不会显示它。
{{1}}