如何从记录集创建统计样本?

时间:2013-03-11 16:56:59

标签: r

我在Windows 7上使用SQL Server 2008和RGui(64位)。我可以使用RODBC从R连接到SQL Server并获取变量中的数据集。理想情况下,我想直接从结果集中抽取一定比例的记录集(比如10%)或固定数字说(25)。

作为一种临时解决方案,我将记录集转储到文件中并从那里开始采样。

有人可以告诉我,如何直接从结果集中采样。

到目前为止

代码:

> library (RODBC)
> conn <- odbcConnect ("TestR", "<username>")
> rs <- sqlQuery ("select Col1 from MyTable")
> sampleDocs <- sample (rs, size = 25, replace = TRUE, prob = NULL)

> set.seed(100)

> write.table(rs, file="C:\\FromTable.txt", row.names=FALSE, col.names=FALSE)
> docs <- read.table ("C:\\FromTable.txt")

> sampleDocs <- sample(docs$V1, size=101, replace=FALSE, prob=NULL)
> write.table(sampleDocs, file=\"C:\\\\SampleDocs.txt\", row.names=FALSE,
               col.names=FALSE)

1 个答案:

答案 0 :(得分:0)

sampleDocs2 <- sample(rs$ColName, size=10, replace=FALSE, prob=NULL)

这样就可以了!