我正在第一次使用Weka。将数据加载到资源管理器后,我使用RandomTree计算了分类器模型。在输出中,我得到以下信息:
RandomTree
==========
center_letter < 0
| center_letter < 0 : A (462/0)
| center_letter >= 0
| | next_letter < 0.06
| | | first_letter < 0.05
| | | | center_letter < 0
| | | | | next_letter < 0.05
| | | | | | first_letter < 0.03 : A (3/0)
| | | | | | first_letter >= 0.03 : B (1/0)
| | | | | next_letter >= 0.05 : B (2/0)
| | | | center_letter >= 0 : A (21/0)
| | | first_letter >= 0.05 : B (5/0)
| | next_letter >= 0.06 : B (20/0)
center_letter >= 0
... so on
据此我理解没有任何意义: 如果“ center_letter”的值为负(在我的数据中没有负值!),它将在第一条语句中输入该节点。然后,它再次检查同一件事并报告A类(是否发生了462个值?)。但是随后它进入了一个分支,其中“ center_letter”为非负数,这是不可能的,并且仍然在内部条件下找到值。
读这棵树的正确方法是什么,因为我读的没有任何意义?找不到说明的链接会很棒。
答案 0 :(得分:2)
像这样将您的眼睛绑在破折号上
center_letter < 0
|
center_letter >= 0
它们就像传统的分支<即左右,然后:
center_letter < 0 : A (462/0)
是一片叶子,即停下来然后用短划线继续:
center_letter >= 0
有两个孩子:
next_letter < 0.06
|
next_letter >= 0.06 : B (20/0) this is leaf and stops the navigation
然后继续
next_letter < 0.06
等等。