Question

我有一个看起来像这样的DataFrame：

它有两列，其中一列是＆＃34;来自＆＃34;日期时间，其中一个是＆＃34;到＆＃34;约会时间。我想更改此DataFrame，使其具有日期的单个列或索引（例如，日期时间表中的2015-07-06 00:00:00）以及其他列的变量（如deep）按比例分配到每一天。怎么可能解决这个问题？我已经干涉groupby伎俩，我不确定如何继续。

Answer 1

所以我目前没有时间解决您的具体问题。但接近这一点的方法是我们pandas.resample()。以下是我要采取的步骤。 1）每分钟重新采样您的日期。 2）在重新采样上填充其他列。 3）将日期列作为索引添加回来。

如果这不起作用或者使用起来很棘手，我会创建一个从最早的日期到最新日期的日期范围（以你想要的最小间隔 - 也许每小时？）然后运行一些条件语句您的其他列填写数据。

以下是您的代码可能与重新取样部分相似的内容（用小时或其他代替日期）：

  drange = pd.date_range('01-01-1970', '01-20-2018', freq='D')
  data = data.resample('D').fillna(method='ffill')
  data.index.name = 'date'

希望这有帮助！

如何将DataFrame从两列（a＆＃34;来自＆＃34; datetime和＆＃34;到＆＃34; datetime）更改为具有单个列的日期？

1 个答案: