Question

在我学习＆＃34;之后来自火车数据的我的箱子，使用np.histogram(A['my_var'])如何在我的测试集上应用它？在哪个bin是每个数据点的my_var属性？如果重要的话，我的火车和测试数据都在熊猫数据框中。

由于

Answer 1

糟糕。这很容易。

hist = np.histogram(A['my_var'])
A.loc[:, 'my_bin'] = np.digitize(A['my_var'], hist[1])