我在Pandas DataFrame中有一些日常数据,它有一个很好的索引。像这样:
import pandas as pd
import numpy as np
rng = pd.date_range('1/1/2010', periods=1000, freq='D')
ts = pd.DataFrame(randn(len(rng)), index=rng, columns=['vals'])
print ts.head()
vals
2010-01-01 1.098302
2010-01-02 -1.384821
2010-01-03 -0.426329
2010-01-04 -0.587967
2010-01-05 -0.853374
我想将我的DataFrame仅限于2月2日和2月2日之间的记录。 3月3日所有年份。
似乎应该有一种非常像熊猫式的方式来做这件事,但我很难找到它。有什么帮助吗?
答案 0 :(得分:6)
我认为没有本地方法可以做到这一点(there is with between times)。
但是你可以天真地做到这一点(这将是有效的,但写起来很痛苦!):
In [11]: ts[((ts.index.month == 2) & (2 <= ts.index.day) # in Feb after the 2nd inclusive
| (ts.index.month == 3) & (ts.index.day <= 3))] # in March before the 3rd inclusive
Out[11]:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 94 entries, 2010-02-01 00:00:00 to 2012-03-03 00:00:00
Data columns (total 1 columns):
vals 94 non-null values
dtypes: float64(1)
答案 1 :(得分:1)
要选择涵盖多个月的年度回归期的所有记录,请执行以下操作:
rng = pd.date_range('2010-1-1', periods=1000, freq='D')
df = pd.DataFrame(np.random.randn(len(rng)), index=rng, columns=['A'])
startMM, startdd = (2,15) # Feb 15th
endMM, enddd = (10,3) # Oct 3rd
month_day = pd.concat([
df.index.to_series().dt.month,
df.index.to_series().dt.day
], axis=1).apply(tuple, axis=1)
df[(month_day >= (startMM, startdd)) & (month_day <= (endMM, enddd))]
@IanS在https://stackoverflow.com/a/45996897/2459096 中提到的