我使用的威斯康星数据集有两个分类列IDs
和class
。为了进行分类,我必须从数据框中删除这两列,然后将数据集拆分为训练和测试(80%:20%)。我完成了这个,但现在我想将相应的类合并到拆分数据集。
然后我必须将拆分类放入一个新的向量中。
示例:
data <- read.csv("data.csv")
data <-data[,-1] #drop IDs
data <-data[,-10] #drop class
X <-data.frame((scale(data)))
dt = sort(sample(nrow(X), nrow(X)*8))
training <-X[dt,]
test<-X[-dt,]
从这里我需要合并与样本对应的类。
答案 0 :(得分:0)
我会这样做:
# read data
data <- read.csv("data.csv")
# split the data
X <-data.frame((scale(data[,-c(1,10)])))
dt = sort(sample(nrow(X), nrow(X)*8))
training <-X[dt,]
test<-X[-dt,]
# add columns
training <- cbind(training, data[dt, c(1,10)])
test <- cbind(test, data[-dt, c(1, 10)])