Question

我找不到一种方法来执行以下操作：我的数据如下：

Time (CET)        Start              Duration(min)  End
2015-02-01 00:00  2015-02-01 00:00   2              2015-02-01 00:02

我想要拥有的是，根据持续时间或结束日期，以以下方式重复每一行（包含条目，很多没有）：

Time (CET)        Start              Duration(min)  End
2015-02-01 00:00  2015-02-01 00:00   2              2015-02-01 00:02
2015-02-01 00:01  2015-02-01 00:00   2              2015-02-01 00:02
2015-02-01 00:02  2015-02-01 00:00   2              2015-02-01 00:02

在结束数据框中，不再需要开始和结束列。我考虑过使用shift，但是不确定是否马上就可以使用以及如何使用参数freq。任何想法如何做到这一点？

“时间”列采用日期时间格式，而“时间（CET）”是索引。

一吨！

Answer 1

您可以将Index.repeat与loc重复行，并将cumcount与to_timedelta创建的时间增量添加到列Time (CET)：

print (df)
         Time (CET)             Start  Duration(min)               End
0  2015-02-01 00:00  2015-02-01 00:00              2  2015-02-01 00:02
1  2015-02-02 00:00  2015-02-02 00:00              3  2015-02-02 00:02

#convert columns to datetimes
c = ['Time (CET)','Start','End']
df[c] = df[c].apply(pd.to_datetime)

df = df.loc[df.index.repeat(df['Duration(min)'] + 1)]
df['Time (CET)'] += pd.to_timedelta(df.groupby(level=0).cumcount(), unit='s') * 60
df = df.reset_index(drop=True).drop(['Start','End'], axis=1)
print (df)
           Time (CET)  Duration(min)
0 2015-02-01 00:00:00              2
1 2015-02-01 00:01:00              2
2 2015-02-01 00:02:00              2
3 2015-02-02 00:00:00              3
4 2015-02-02 00:01:00              3
5 2015-02-02 00:02:00              3
6 2015-02-02 00:03:00              3

根据开始日期和结束日期重复行

1 个答案: