我有一个名为data.csv
的csv文件,例如
TS;val
10:00;0.1
10:05;0.2
10:10;0.3
10:15;0.4
我使用此脚本
读取了此csv文件#!/usr/bin/env python
import pandas as pd
if __name__ == "__main__":
yyyy = 2013
mm = 2
dd = 1
df = pd.read_csv('data.csv', sep=';', parse_dates=[0], index_col=0)
print(df)
我明白了
val
TS
2013-06-17 10:00:00 0.1
2013-06-17 10:05:00 0.2
2013-06-17 10:10:00 0.3
2013-06-17 10:15:00 0.4
我想将每个DateTimeIndex的日期更改为2013-02-01
val
TS
2013-02-01 10:00:00 0.1
2013-02-01 10:05:00 0.2
2013-02-01 10:10:00 0.3
2013-02-01 10:15:00 0.4
更简单的方法是什么?
答案 0 :(得分:10)
时间戳有一个replace
方法(就像日期时间一样):
In [11]: df.index.map(lambda t: t.replace(year=2013, month=2, day=1))
Out[11]:
array([Timestamp('2013-02-01 10:00:00', tz=None),
Timestamp('2013-02-01 10:05:00', tz=None),
Timestamp('2013-02-01 10:10:00', tz=None),
Timestamp('2013-02-01 10:15:00', tz=None)], dtype=object)
所以设置你的索引:
In [12]: df.index = df.index.map(lambda t: t.replace(year=2013, month=2, day=1))
值得一提的是,您可以将date_parser
函数传递给read_csv
,这对您来说更有意义:
In [21]: df = pd.read_csv(file_name, sep=';', parse_dates=[0], index_col=0,
date_parser=lambda time: pd.Timestamp('2013/02/01 %s' % time))
In [22]: df
Out[22]:
val
TS
2013-02-01 10:00:00 0.1
2013-02-01 10:05:00 0.2
2013-02-01 10:10:00 0.3
2013-02-01 10:15:00 0.4
答案 1 :(得分:1)
提供date_parser
In [50]: pd.read_csv(StringIO(data), sep=';', parse_dates=[0],
index_col=0, date_parser=lambda x: Timestamp('20130201 %s' % x))
Out[50]:
val
TS
2013-02-01 10:00:00 0.1
2013-02-01 10:05:00 0.2
2013-02-01 10:10:00 0.3
2013-02-01 10:15:00 0.4
答案 2 :(得分:0)
我看到两种方法。第一个是最简单的:使用'string'.split(' ')
。对于字符串bb jj
,它将返回包含2个元素bb
和jj
的列表,因此只需获取第一个元素。
第二个选项是从字符串创建日期时间对象,并按照您希望的方式重新格式化。在我看来,这个解决方案更好。如果明天你想要另一种格式,这将更容易。
为此:请使用此处记录的strptime
函数:http://docs.python.org/2/library/datetime.html#datetime.datetime.strptime
然后从datetime对象返回一个字符串,只需使用strftime function即可。这里提供了所有不同的格式:http://docs.python.org/2/library/datetime.html#strftime-and-strptime-behavior