运行以下代码时,通过强制错误引入以下NAs:
install.packages("class")
library("class")
mydata <- read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data", sep=",", header=FALSE)
mydata <- na.omit(mydata)
index <- 1:nrow(mydata)
testindex <- sample(index, trunc(length(index)/6))
testset <-mydata[testindex,]
trainset <- mydata[-testindex,]
kblah2 <- knn(train = trainset['V9'],
test=testset['V9'],
cl=as.factor(trainset[['V15']]) ,
k=1, l=0, prob=F, use.all=T)
我不知道该怎么做。
由于
答案 0 :(得分:0)
我也有这个问题。就我而言,这是因为我从Excel导入了数据,而excel在数字之间使用逗号表示数千。例如:“ 200,000”。