R(rpart程序包)的决策树中的控制拆分(大于或等于,小于)

时间:2019-04-23 13:11:14

标签: r decision-tree rpart

我正在研究R中的决策树。我希望决策/拆分中的符号一致,也就是说,希望决策始终采用“ x = b”的形式。

从虹膜和泰坦尼克号数据集中考虑这些示例

dict_of_arrs

虹膜树的结果是:

library(rpart)
library(dplyr)

#iris
tree_iris <- rpart(Species ~ ., data = iris, method = 'class')

#titanic
set.seed(678)
path <-'https://raw.githubusercontent.com/thomaspernet/data_csv_r/master/data/titanic_csv.csv'
titanic <-read.csv(path)
titanic <- select(titanic, -c(home.dest, cabin, name, X, ticket, embarked))
tree_titanic <- rpart(survived ~ ., data = titanic, method = 'class', cp = 0.02)

泰坦尼克号树的结果是:

1) root 150 100 setosa (0.33333333 0.33333333 0.33333333)  
  2) Petal.Length< 2.45 50   0 setosa (1.00000000 0.00000000 0.00000000) *
  3) Petal.Length>=2.45 100  50 versicolor (0.00000000 0.50000000 0.50000000)  
    6) Petal.Width< 1.75 54   5 versicolor (0.00000000 0.90740741 0.09259259) *
    7) Petal.Width>=1.75 46   1 virginica (0.00000000 0.02173913 0.97826087) *

如您所见,对于第一个示例,决策的格式为'x = b'的形式,并且左子节点表示此语句为true。我是否可以对此进行控制,以使决策始终采用'x

0 个答案:

没有答案