数据框中每月的平均值,日期为列

时间:2020-07-25 09:43:26

标签: python python-3.x pandas dataframe pandas-resample

感谢您花时间帮助我:)

我有如下所示的DataFrame(df_NSE_Price _):

Company Name                ID      2000-01-03 00:00:00 2000-01-04 00:00:00 ....
Reliance Industries Ltd.    100325  50.810              54.
Tata Consultancy Service    123455  123                 125
..

我想要如下输出:

Company Name                ID      March 00   April 00 .....
Reliance Industries Ltd    100325   52         55
Tata Consultancy Services  123455   124.3      124
..

输出数据必须具有每月数据的平均值。

到目前为止,我已经尝试过

df_NSE_Price_.resample('M',axis=1).mean()

但这给了我错误 仅对DatetimeIndex,TimedeltaIndex或PeriodIndex有效,但具有“ Index”的实例

2 个答案:

答案 0 :(得分:1)

类似这样的方法应该起作用: df.transpose()。resample('M',axis = 1).mean()。transpose()

答案 1 :(得分:0)

首先,我将数据转换为数据框(我也添加了包含2月信息的列)。

import pandas as pd

columns = ('Company Name', 
           'ID', 
           '2000-01-03 00:00:00', 
           '2000-01-04 00:00:00', 
           '2000-02-04 00:00:00')

data = [('Reliance Industries Ltd.', 100325, 50.810, 54., 66.0),
        ('Tata Consultancy Service', 123455, 123, 125, 130.0),]

df = pd.DataFrame(data=data, columns=columns)

第二,我使用公司和ID创建了一个二级索引(MultiIndex)。现在,所有列标签都是日期。然后,我将列标签转换为日期格式(使用.to_datetime()

df = df.set_index(['Company Name', 'ID'])
df.columns = pd.to_datetime(df.columns)

第三,我按月间隔重新采样,使用“ axis = 1”按列进行汇总。这将为每列创建一个月。使用'to_period()'将月末日期转换为期间:

df = df.resample('M', axis=1).sum()
df.columns = df.columns.to_period('M')

                                 2000-01  2000-02
Company Name             ID                      
Reliance Industries Ltd. 100325   104.81     66.0
Tata Consultancy Service 123455   248.00    130.0