我在Windows 7上使用SQL Server 2008和RGui(64位)。我可以使用RODBC从R连接到SQL Server并获取变量中的数据集。理想情况下,我想直接从结果集中抽取一定比例的记录集(比如10%)或固定数字说(25)。
作为一种临时解决方案,我将记录集转储到文件中并从那里开始采样。
有人可以告诉我,如何直接从结果集中采样。
到目前为止代码:
> library (RODBC)
> conn <- odbcConnect ("TestR", "<username>")
> rs <- sqlQuery ("select Col1 from MyTable")
> sampleDocs <- sample (rs, size = 25, replace = TRUE, prob = NULL)
> set.seed(100)
> write.table(rs, file="C:\\FromTable.txt", row.names=FALSE, col.names=FALSE)
> docs <- read.table ("C:\\FromTable.txt")
> sampleDocs <- sample(docs$V1, size=101, replace=FALSE, prob=NULL)
> write.table(sampleDocs, file=\"C:\\\\SampleDocs.txt\", row.names=FALSE,
col.names=FALSE)
答案 0 :(得分:0)
sampleDocs2 <- sample(rs$ColName, size=10, replace=FALSE, prob=NULL)
这样就可以了!