基于不同数据的熊猫分组

时间:2015-06-19 04:33:59

标签: python pandas

我想根据不同的数据框剪切对数据进行分组。

例如,我从一个框架切割出来:

my_fcuts = pd.qcut(frame1['prices'],5)

pd.groupby(frame2, my_fcuts)

由于长度必须相同,因此上述语句将失败。

我知道我可以轻松编写一个mapper函数,但是如果是这样的话

my_fcuts = pd.qcut(frame1 ['price'],20)或更高的数字。当然,熊猫必须有一些内置的声明才能做到这一点非常简单。 groupby应该能够接受来自不同数据的“削减”并重新分类。

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

谢谢我自己找到了答案

volgroups = np.digitize(btest['vol_proxy'],np.linspace(min(data['vol_proxy']), max(data['vol_proxy']), 10))
trendgroups = np.digitize(btest['trend_proxy'],np.linspace(min(data['trend_proxy']), max(data['trend_proxy']), 10))

#btest.groupby([volgroups,trendgroups]).mean()['pnl'].plot(kind='bar')
#plt.show()

df = btest.groupby([volgroups,trendgroups]).groups