我正在使用Pandas 0.8.1获取雅虎股票价格
from datetime import datetime
from pandas.io.data import DataReader
stk_price = DataReader('600809.ss', 'yahoo', datetime(2006,1,1), datetime(2012,12,31)).reset_index()
>>> stk_price.Date
0 2010-01-04 00:00:00
1 2010-01-05 00:00:00
2 2010-01-06 00:00:00
3 2010-01-07 00:00:00
4 2010-01-08 00:00:00
我想将Date转换为字符串:
>>>stk_price.Date.astype('|S10')
0 1970-01-15
1 1970-01-15
2 1970-01-15
3 1970-01-15
4 1970-01-15
5 1970-01-15
为什么它显示“1970-01-15”而不是“2010-01-04”等?如何解决?
如果我有
DATE_LIST = [
u'20090331', u'20090630', u'20090930', u'20091231', \
u'20100331', u'20100630', u'20100930', u'20101231', \
u'20110331', u'20110630', u'20110930', u'20111231', \
u'20120331', u'20120630', u'20120930', u'20121231'
]
我只是尝试按以下方式过滤其日期列位于stk_price
的{{1}}行:
DATE_LIST
但是第一个是空的。
如何解决它或任何Pandas功能可以过滤结果?
答案 0 :(得分:2)
使用df.Date=df.Date.apply(lambda x:x.date())
转换日期时间列
>>> df=DataFrame({'Date':[datetime(2006,1,1)]})
>>> df
Date
0 2006-01-01 00:00:00
>>> df.Date=df.Date.apply(lambda x:x.date())
>>> df
Date
0 2006-01-01
编辑:
格式化DATE_LIST
dates=[datetime.datetime.strptime(i, "%Y%m%d").date() for i in DATE_LIST]
最后使用isin
过滤掉DATE_LIST中的行:
df[df['Dates'].isin(dates)]
一次性(假设您的stk_price数据框有一个名为Date的日期列):
import datetime
stk_price = DataReader('600809.ss', 'yahoo', datetime(2006,1,1), datetime(2012,12,31)).reset_index()
stk_price.Date=stk_price.Date.apply(lambda x:x.date())
dates=[datetime.datetime.strptime(i, "%Y%m%d").date() for i in DATE_LIST]
stk_price[stk_price['Dates'].isin(dates)]
答案 1 :(得分:1)
您可以将DATE_LIST转换为时间戳并将其直接用于索引stk_price,而不是将stk_price日期转换为字符串(由于numpy错误显示错误的日期,另请参阅github issue #1802)。下面是包含随机数据的帧的示例。
In [16]: DATE_LIST = [
u'20090331', u'20090630', u'20090930', u'20091231', \
u'20100331', u'20100630', u'20100930', u'20101231', \
u'20110331', u'20110630', u'20110930', u'20111231', \
u'20120331', u'20120630', u'20120930', u'20121231'
]
In [17]: timestamps = [pd.Timestamp(date) for date in DATE_LIST]
In [18]: df = pd.DataFrame(np.random.randn(100,3), index=pd.date_range('20090331', periods=100))
In [19]: df.ix[timestamps].dropna()
Out[19]:
0 1 2
2009-03-31 0.520235 1.158889 -0.310227
2009-06-30 1.036449 0.528931 -0.083166