如何分割和数据集进入训练和测试并合并他们相应的"类"在R

时间:2018-03-10 12:12:44

标签: r classification knn train-test-split

我使用的威斯康星数据集有两个分类列IDsclass。为了进行分类,我必须从数据框中删除这两列,然后将数据集拆分为训练和测试(80%:20%)。我完成了这个,但现在我想将相应的类合并到拆分数据集。 然后我必须将拆分类放入一个新的向量中。

示例:

data <- read.csv("data.csv")
data <-data[,-1] #drop IDs
data <-data[,-10] #drop class
X <-data.frame((scale(data)))
dt = sort(sample(nrow(X), nrow(X)*8))
training <-X[dt,]
test<-X[-dt,]

从这里我需要合并与样本对应的类。

1 个答案:

答案 0 :(得分:0)

我会这样做:

# read data
data <- read.csv("data.csv")

# split the data
X <-data.frame((scale(data[,-c(1,10)])))
dt = sort(sample(nrow(X), nrow(X)*8))
training <-X[dt,]
test<-X[-dt,]

# add columns
training <- cbind(training, data[dt, c(1,10)])
test <- cbind(test, data[-dt, c(1, 10)])