我有以下数据集:
1)以月为时间戳记的数据集
df = pd.DataFrame(residuals, columns = ['Passengers'])
Passengers
Month
1949-01-01 -0.082329
1949-02-01 -0.040724
1949-03-01 0.060813
1949-04-01 0.027243
1949-05-01 -0.047359
1949-06-01 0.051545
1949-07-01 0.132902
1949-08-01 0.122322
b)月份为整数的数据集
dz = pd.DataFrame(estacionalitat, columns = ['Passengers'])
Passengers
Month
1 -0.075844
2 -0.089111
3 0.042705
4 0.002147
5 -0.010528
6 0.109443
7 0.198334
8 0.209830
两个数据集中都进行了一组转换,但原始数据来自以下数据集:
data = pd.read_csv('AirPassengers.csv', parse_dates=['Month'], index_col='Month', header=0)
我想从另一个数据集中减去一个数据集,如下所示:
df-dz
但是,当我尝试执行上述操作时,会收到以下消息:
无法将类型“时间戳”与类型“ int”
我猜这是因为“月”在一个数据集中的类型为int,而在另一个数据集中的类型是“日期”。此外,我不知道如何访问“月”,因为它不被理解为一列。
答案 0 :(得分:2)
如果要将DatetimeIndex
转换为月份,请使用:
df.index = df.index.month
然后两者都得到整数,列名相同,所以可以减去:
df = df-dz
print (df)
Passengers
Month
1 -0.006485
2 0.048387
3 0.018108
4 0.025096
5 -0.036831
6 -0.057898
7 -0.065432
8 -0.087508