我是R编程的新手,并尝试从教程中运行随机森林的示例代码:Random Forest Using R: Step by Step Tutorial。 对于代码的第二行:
names(termCrosssell)
我得到的结果如下:
age.job.marital.education.default.balance.housing.loan.contact.day.month.duration.campaign.pdays.previous.poutcome.y
然而,在教程中格式不同。我想知道我是否没有正确安排数据文件。其次,对于
table(termCrosssell$y)/nrow(termCrosssell)
我正在
# numeric(0)
我无法理解结果。我试图找到有关数据文件的安排,但无法得到答案。
答案 0 :(得分:2)
如果没有可重复的数据,很难解决您的问题。我按照链接,下载了数据集,但后来不得不打开并重命名.csv文件。实际上,该文件使用“;”作为分隔符。我得到了正确的结果:
termcrosssell <- read.csv(file="crosssell.csv", header = T, sep = ";")
names(termcrosssell)
[1] "age" "job" "marital" "education" "default" "balance" "housing"
[8] "loan" "contact" "day" "month" "duration" "campaign" "pdays"
[15] "previous" "poutcome" "y"