任何人都能告诉我这段R代码的作用吗?

时间:2017-04-19 13:15:35

标签: r rstudio

set.seed(1234)
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))      
trainData <- data[dataPartition ==1,]
testData <- [dataPartition ==2,] 

1 个答案:

答案 0 :(得分:2)

它将您的数据分为两组。

       sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))   

您在矩阵的长度中对矢量进行采样,该矢量由1和2组成,概率为0.7和0.3。

       trainData <- data[dataPartition ==1,]
        testData <- data[Partition ==2,] ## Fixed the brackets 

这只是将您的数据分成两部分,以便能够(我推测)验证模型。 以下是为什么将数据划分为火车和测试的更详细的答案 https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set