我想知道所有决策树都是二叉树吗?
感谢
答案 0 :(得分:3)
不,他们不是。如果决定是“你最喜欢的颜色是什么?”该怎么办?如果您接受每通道8位RGB,则可能有20亿个答案。
答案 1 :(得分:0)
否。所有决策树都不是二叉树。但是,如果你真的想要二叉树,你也可以这样做。实际上,分支的数量取决于您要分类的数据的性质。
有两种类型的数据。
<强> 1。离散数据
<强> 2。连续数据
假设A
是分裂属性,A
根据训练数据具有不同的值{a_1, a_2, ... , a_v}
。然后有3个案例。
案例1:A
是离散值 - 为a_j
中A
的每个已知值创建一个分支。例如,如果age
是离散值attrribute,它可以分支为young
,medium
或old
。
案例2:A
是连续值 - 测试节点有两个可能的结果,分别对应条件A <= split_point
和A > split_point
。例如,如果age
是连续值属性,则可以按条件age <= 55
和age > 55
进行分支。
案例3 - A
是离散值,必须生成二叉树 - 节点上的测试is A in splitting_subset ?
,其中{{1}在两个决策中,某个决策中可接受的值集合。例如,如果splitting_subset
是离散值属性,则可以通过age
的测试形式进行分支。