我有一个看起来像这样的DataFrame:
它有两列,其中一列是"来自"日期时间,其中一个是"到"约会时间。我想更改此DataFrame,使其具有日期的单个列或索引(例如,日期时间表中的2015-07-06 00:00:00)以及其他列的变量(如deep
)按比例分配到每一天。怎么可能解决这个问题?我已经干涉groupby
伎俩,我不确定如何继续。
答案 0 :(得分:0)
所以我目前没有时间解决您的具体问题。但接近这一点的方法是我们pandas.resample()。以下是我要采取的步骤。 1)每分钟重新采样您的日期。 2)在重新采样上填充其他列。 3)将日期列作为索引添加回来。
如果这不起作用或者使用起来很棘手,我会创建一个从最早的日期到最新日期的日期范围(以你想要的最小间隔 - 也许每小时?)然后运行一些条件语句您的其他列填写数据。
以下是您的代码可能与重新取样部分相似的内容(用小时或其他代替日期):
drange = pd.date_range('01-01-1970', '01-20-2018', freq='D')
data = data.resample('D').fillna(method='ffill')
data.index.name = 'date'
希望这有帮助!