无法将“时间戳”类型与“ int”类型进行比较-减去数据集

时间:2020-01-02 10:40:48

标签: python pandas numpy dataframe timestamp

我有以下数据集:

1)以月为时间戳记的数据集

df = pd.DataFrame(residuals, columns = ['Passengers']) 
             Passengers
Month   
1949-01-01  -0.082329
1949-02-01  -0.040724
1949-03-01  0.060813
1949-04-01  0.027243
1949-05-01  -0.047359
1949-06-01  0.051545
1949-07-01  0.132902
1949-08-01  0.122322

b)月份为整数的数据集

dz = pd.DataFrame(estacionalitat, columns = ['Passengers']) 

    Passengers
Month   
1   -0.075844
2   -0.089111
3   0.042705
4   0.002147
5   -0.010528
6   0.109443
7   0.198334
8   0.209830

两个数据集中都进行了一组转换,但原始数据来自以下数据集:

data = pd.read_csv('AirPassengers.csv', parse_dates=['Month'], index_col='Month', header=0)

我想从另一个数据集中减去一个数据集,如下所示:

df-dz

但是,当我尝试执行上述操作时,会收到以下消息:

无法将类型“时间戳”与类型“ int”

我猜这是因为“月”在一个数据集中的类型为int,而在另一个数据集中的类型是“日期”。此外,我不知道如何访问“月”,因为它不被理解为一列。

1 个答案:

答案 0 :(得分:2)

如果要将DatetimeIndex转换为月份,请使用:

df.index = df.index.month

然后两者都得到整数,列名相同,所以可以减去:

df = df-dz
print (df)
       Passengers
Month            
1       -0.006485
2        0.048387
3        0.018108
4        0.025096
5       -0.036831
6       -0.057898
7       -0.065432
8       -0.087508