在决策树中,我们可以通过首先按某个特征列对训练样本进行排序来提高找到良好分割的速度。但是,由于所有功能都是数字,因此建议Radix排序可能实际上是最快的。我无法弄清楚如何使用Radix排序按列对Numpy数组进行排序。
从here开始,我们可以使用mergesort,quicksort或heapsort按列(例如,第1列)对numpy数组进行排序:
a[a[:,1].argsort()]
Here's Python中的基数排序实现效果很好。
你如何将两者结合起来?我希望得到以下行为:
a[a[:, 1].argsort(kind="radix")]
这可能吗?