应用错误收集

如何将记录传递给决策树？

时间：2013-06-17 11:09:15

标签： r decision-tree

我正在做一个小项目。可以说，我有一个大约100K记录的表，其中包含年龄，性别，地区，生活（名义 - 使用产品的天数范围）等列，此处生活是一个因变量，所有其他都是独立变量。我创建了可用数据中的决策树。现在我的查询是，假设我有一条新记录，我想知道在遍历决策树之后该记录落在哪个终端节点，即该记录落在哪个Life范围内。为此，我如何将该记录传递给决策树并获得输出？

1 个答案:

答案 0 :(得分：0)

predict(model,newdata)

让我们说你的原始data.frame在你的问题中列出了4列。您的新记录需要格式化为data.frame，其列名与您的独立因子相同，例如newdata = data.frame(Age=15,Gender="Male",Region="Southwest")或这些值应该是什么。假设您已经存储了模型model = rpart(Life~.,data=data,method="class")，然后predict(model,newdata)将返回新记录属于每个终端类的概率向量。然后，您需要使用一些截止逻辑来确定您将哪个组分配给它。