我有一个包含每日数据的.csv文件,如下所示:
some 19 more header rows
Werte
01.01.1971 07:00:00 ; 0.0
02.01.1971 07:00:00 ; 1.2
...and so on
我导入的:
RainD=pd.read_csv('filename.csv',skiprows=20,sep=';',dayfirst=True,parse_dates=True)
结果,我得到了
In [416]: RainD
Out[416]:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 14976 entries, 1971-01-01 07:00:00 to 2012-01-01 07:00:00
Data columns:
Werte: 14976 non-null values
dtypes: object(1)
所以它是一个数据帧,但也许时间序列可能是正确的方式?但是如何导入呢? pandas文档列出了dtype
中的read_csv
选项,但没有关于我可以/应该指定的内容的信息。
但另一方面,DatetimeIndex:
在我看来,大熊猫非常清楚我在这里处理日期,但仍然使它成为一个数据帧。为此,RainD['1971']
之类的内容只会导致u'no item named 1971'
密钥错误。
我觉得我只是遗漏了一些非常明显的东西,因为时间序列分析似乎就是熊猫所做的事情。
我的另一个想法是,大熊猫可能会被日期写成正确的(即dd.mm.yyyy;))方式而感到困惑,但是{{1}告诉我,我可以消化那么好。
此致 JC
答案 0 :(得分:1)
EdChum&#39; df[df.index.year == 1971]
解决了我的问题。
我可能还有其他一些问题(即熊猫的过期版本),但就目前而言,我可以继续工作。