我正在研究R中的决策树。我希望决策/拆分中的符号一致,也就是说,希望决策始终采用“ x = b”的形式。
从虹膜和泰坦尼克号数据集中考虑这些示例
dict_of_arrs
虹膜树的结果是:
library(rpart)
library(dplyr)
#iris
tree_iris <- rpart(Species ~ ., data = iris, method = 'class')
#titanic
set.seed(678)
path <-'https://raw.githubusercontent.com/thomaspernet/data_csv_r/master/data/titanic_csv.csv'
titanic <-read.csv(path)
titanic <- select(titanic, -c(home.dest, cabin, name, X, ticket, embarked))
tree_titanic <- rpart(survived ~ ., data = titanic, method = 'class', cp = 0.02)
泰坦尼克号树的结果是:
1) root 150 100 setosa (0.33333333 0.33333333 0.33333333)
2) Petal.Length< 2.45 50 0 setosa (1.00000000 0.00000000 0.00000000) *
3) Petal.Length>=2.45 100 50 versicolor (0.00000000 0.50000000 0.50000000)
6) Petal.Width< 1.75 54 5 versicolor (0.00000000 0.90740741 0.09259259) *
7) Petal.Width>=1.75 46 1 virginica (0.00000000 0.02173913 0.97826087) *
如您所见,对于第一个示例,决策的格式为'x = b'的形式,并且左子节点表示此语句为true。我是否可以对此进行控制,以使决策始终采用'x