标签: python scikit-learn sampling
我想从数据集中创建一个子样本,同时在某些边界内保留一些聚合度量。
例如 - 我想绘制10%的行并将平均属性X保持在某些边界内。
这实际上是分层。我在Python中工作并且通常使用frm.Dirty = False,但我不知道在我的情况下是否可以以某种方式使用它。
frm.Dirty = False