使用tree
配置用于构造分类树的tree.control
命令(使用“树”库)。 tree.control
帮助页面解释了minsize
和mincut
参数,如下所示:
mincut
The minimum number of observations to include in either child node.
This is a weighted quantity; the observational weights are used to
compute the ‘number’. The default is 5.
minsize
The smallest allowed node size: a weighted quantity. The default is 10.
对我来说,这两个描述似乎说的很相似。 mincut
和minsize
之间有什么区别?
答案 0 :(得分:2)
据我了解,对于分类,mincut
确定每个类所需的最小观察次数,其中minsize
是节点所需的最小观察次数。
举个例子,假设我在一个节点中有14个观察值,并决定是否拆分。如果11个在A级而在B级只有4个,那么我不应该拆分,因为我没有每个班级至少5个。如果我在A级有10个,在B级有5个,那么我可以分开。