CS 4407数据挖掘和机器学习

时间:2018-12-18 05:17:07

标签: arrays

第1部分:打印决策树

a。首先,设置工作目录,加载所需的软件包(rpart和mlbench),然后加载Ionosphere数据集。

根据需要设置工作目录(根据需要修改路径)

setwd(“工作目录”)

加载所需的库–用于分类和回归树的rpart

库(rpart)

电离层数据集的mlbench

库(mlbench)

加载电离层

数据(电离层)

b。使用rpart()方法为数据创建回归树。

rpart(Class〜。,Ionosphere)

c。使用plot()和text()方法来绘制决策树。

第2部分:估算准确性

a。将数据拆分为测试并使用sample()方法训练子集。

b。使用rpart方法使用训练数据创建决策树。

rpart(Class〜。,Ioosphere,subset = train)

c。使用预测方法可找到测试数据的预测类标签。

d。使用表格方法创建预测表与真实标签的表,然后计算准确性。准确度是正确分配的好案例(真实肯定)的数量加上正确分配的坏情况(真实否定)的数量除以测试案例的总数。

0 个答案:

没有答案