在使用Pandas阅读文件时,我在解析文件的日期时遇到了一些麻烦。
我正在使用python(x,y),版本2.7。
我正在尝试阅读的文件格式如下:
"
SomethingSomethig,
SomethingSomethig,
SomethingSomethig,
Est,dir,Vmed,raj,Vmin,desv.padrão,date,
555,162,5.30,10.10,6.50,0.67,200901010000,
555,135,6.10,10.90,6.40,0.67,200901010010,
555,156,5.90,11.00,5.90,0.76,200901010020,
555,178,6.90,10.90,5.30,0.96,200901010030,
555,200,9.80,11.20,6.10,0.96,200901010040,
555,100,9.70,11.40,5.70,0.96,200901010050,"
使用以下代码行:
dados = read_csv(file, sep=",", skiprows=3, index_col=6,parse_dates=True)
输出是:
""
Int64Index: 157968 entries, 200901010000 to 201112312350
Data columns:
Est 157968 non-null values
dir 157968 non-null values
Vmed 157968 non-null values
raj 157968 non-null values
Vmin 157968 non-null values
desv.padr?o 157968 non-null values
Unnamed: 7 157968 non-null values
dtypes: float64(4), int64(2), object(1)
""
未解析日期。当我尝试使用日期执行任何类型的计算时,我收到错误。我不知道如何使用转换器,可以真正使用你的帮助。
答案 0 :(得分:5)
对我来说很好:
In [3]: read_csv('/home/wesm/tmp/foo.txt', skiprows=3, index_col=6, parse_dates=True)
Out[3]:
Est dir Vmed raj Vmin desv.padrão Unnamed: 7
date
2009-01-01 00:00:00 555 162 5.3 10.1 6.5 0.67 NaN
2009-01-01 00:10:00 555 135 6.1 10.9 6.4 0.67 NaN
2009-01-01 00:20:00 555 156 5.9 11.0 5.9 0.76 NaN
2009-01-01 00:30:00 555 178 6.9 10.9 5.3 0.96 NaN
2009-01-01 00:40:00 555 200 9.8 11.2 6.1 0.96 NaN
2009-01-01 00:50:00 555 100 9.7 11.4 5.7 0.96 NaN
您使用的是哪个版本的熊猫?也许有一个问题只出现在整个文件中?