熊猫转换时间序列15分钟数据

时间:2020-09-20 06:01:34

标签: python-3.x pandas time-series python-datetime

我有一个时间序列数据,每15分钟一个时间块获取一次价格值。我想转换每个时间块变成一列的数据,然后得到特定日期的一行。 例如,一个包含2列的数据帧-['Date-Time','Price']生成1 + 96列的数据帧-['Date']和每个时间块96列。

这是我编写的将“小时数”转换为“列”的代码-给出了24列的小时数。我如何在15分钟内将其转换为96列-

def transform_to_hour_cols(series):
    df = pd.DataFrame()

    start = series.index.min()
    end = series.index.max()
    
    df['year'] = series.index.year
    df['month'] = series.index.month
    df['day'] = series.index.day
    df['hours'] = series.index.hour
    df['loads'] = series.values
  
    
    df = df.set_index(['year', 'month', 'day', 'hours'], append=True).unstack()
    df = df.groupby(['year', 'month', 'day']).sum()
    
    df.reset_index(inplace=True)
    df.drop(['year', 'month', 'day'], axis=1, inplace=True)
    
    date_list = pd.date_range(start=start, end=end, freq='D').strftime('%Y-%m-%d')
    
    df.index = pd.DatetimeIndex(date_list, name='date')
    
    return df

price = transform_to_hour_cols(df['Price'])
price.head()

这是示例数据框-

enter image description here

1 个答案:

答案 0 :(得分:2)

  1. 您可以使用datetime创建一个dt.datedt.time列。
  2. 然后,将time发送到各列。为此,首先,必须将datetime放在带有.set_index()的索引上。然后,使用.unstack(1)time移动到列。 1中的unstack()表示您正在传递刚创建的多索引中的第二个索引列。如果您通过了0,那么您应该已经将date发送到了这些列。
  3. 最后,使用.reset_index(level=0)清理列多索引

df = pd.DataFrame({'date' : ['2020-04-01 00:00:00', '2020-04-01 00:15:00',
                             '2020-04-01 00:30:00', '2020-04-01 00:45:00', '2020-04-01 01:00:00'],
                   'mcp' : [2399.21, 2499.07, 2448.89, 2399.80, 2199.89]})
df['date'] = pd.to_datetime(df['date'])
df['time'] = df['date'].dt.time
df['date'] = df['date'].dt.date
df = df.set_index(['date', 'time']).unstack(1).reset_index(level=0)
df
Out[1]: 
           date      mcp                                    
time            00:00:00 00:15:00 00:30:00 00:45:00 01:00:00
0    2020-04-01  2399.21  2499.07  2448.89   2399.8  2199.89

使用您提供的示例数据,我假设您已经按行日期成功地将15分钟间隔分组,因此,这仅有助于您将15分钟间隔分成几列。

相关问题