我想根据不同的数据框剪切对数据进行分组。
例如,我从一个框架切割出来:
my_fcuts = pd.qcut(frame1['prices'],5)
pd.groupby(frame2, my_fcuts)
由于长度必须相同,因此上述语句将失败。
我知道我可以轻松编写一个mapper函数,但是如果是这样的话
my_fcuts = pd.qcut(frame1 ['price'],20)或更高的数字。当然,熊猫必须有一些内置的声明才能做到这一点非常简单。 groupby应该能够接受来自不同数据的“削减”并重新分类。
有什么想法吗?
答案 0 :(得分:0)
谢谢我自己找到了答案
volgroups = np.digitize(btest['vol_proxy'],np.linspace(min(data['vol_proxy']), max(data['vol_proxy']), 10))
trendgroups = np.digitize(btest['trend_proxy'],np.linspace(min(data['trend_proxy']), max(data['trend_proxy']), 10))
#btest.groupby([volgroups,trendgroups]).mean()['pnl'].plot(kind='bar')
#plt.show()
df = btest.groupby([volgroups,trendgroups]).groups