R包“tree”:minsize和mincut有什么区别?

时间:2015-07-21 20:55:32

标签: r classification

使用tree配置用于构造分类树的tree.control命令(使用“树”库)。 tree.control帮助页面解释了minsizemincut参数,如下所示:

mincut  
The minimum number of observations to include in either child node.
This is a weighted quantity; the observational weights are used to
compute the ‘number’. The default is 5.

minsize 
The smallest allowed node size: a weighted quantity. The default is 10.

对我来说,这两个描述似乎说的很相似。 mincutminsize之间有什么区别?

1 个答案:

答案 0 :(得分:2)

据我了解,对于分类,mincut确定每个类所需的最小观察次数,其中minsize是节点所需的最小观察次数。

举个例子,假设我在一个节点中有14个观察值,并决定是否拆分。如果11个在A级而在B级只有4个,那么我不应该拆分,因为我没有每个班级至少5个。如果我在A级有10个,在B级有5个,那么我可以分开。