为什么groupby和roll不能一起工作?

时间:2018-03-12 23:22:24

标签: python pandas dataframe pandas-groupby finance

我有一个df,我从coinmarketcap刮了下来。我正在尝试计算close_price列的volitlity指标,但是当我使用groupby时,我收到一条错误消息:

final_coin_data['vol'] = final_coin_data.groupby('coin_name')['close_price'].rolling(window=30).std()
TypeError: incompatible index of inserted column with frame index

df结构(加载我的CSV后出现'未命名:0'):

    Unnamed: 0  close_price coin_name   date            high_price  low_price    market_cap         open_price  volume
0   1           9578.63     Bitcoin     Mar 11, 2018    9711.89     8607.12      149,716,000,000    8852.78     6,296,370,000
1   2           8866.00     Bitcoin     Mar 10, 2018    9531.32     8828.47      158,119,000,000    9350.59     5,386,320,000
2   3           9337.55     Bitcoin     Mar 09, 2018    9466.35     8513.03      159,185,000,000    9414.69     8,704,190,000
3   1           9578.63     Monero      Mar 11, 2018    9711.89     8607.12      149,716,000,000    8852.78     6,296,370,000
4   2           8866.00     Monero      Mar 10, 2018    9531.32     8828.47      158,119,000,000    9350.59     5,386,320,000
5   3           9337.55     Monero      Mar 09, 2018    9466.35     8513.03      159,185,000,000    9414.69     8,704,190,000

(忽略不正确的价格,这是df的基础知识)

使用以下代码时:

final_coin_data1['vol'] = final_coin_data.groupby('coin_name')['close_price'].rolling(window=30).std().reset_index(0,drop=True)

我遇到了一个MemoryError。我以为我正在使用groupby。如果我取出final_coin_data1['vol'] =然后我得到一个看似正确的系列,但它不会让我插回到df。

当我第一次开始这个项目时。我只有1个硬币,并使用下面的代码,它计算波动率没有问题。

 final_coin_data1['vol'] = final_coin_data['close_price'].rolling(window=30).std()

1 个答案:

答案 0 :(得分:1)

当我跑步时,

final_coin_data['close_price'].rolling(window=30).std()

生成索引列和结果列。当我尝试合并回原始df作为新列final_coin_data1['vol']时,我收到错误TypeError: incompatible index of inserted column with frame index所以为了纠正这个问题,我reset_index(drop=True)然后这消除了允许结果的索引加入final_coin_data1['vol']

最终运行的代码如下所示:

final_coin_data1['vol'] = final_coin_data.groupby('coin_name')['close_price'].rolling(window=30).std().reset_index(0,drop=True)