我正在运行此代码以从r连接到大查询:
project <- xxx
sql <- "select *
from test.test"
data <- query_exec(sql, project = project, max_pages = Inf)
现在的问题是:如果我从大查询控制台运行代码,我会获得189000行。如果我在R中加载数据,只有16000.或者如果我重新运行它20000.或再次15000。 问题出在这里? R似乎没有采用整套数据,而只采用(随机?)子样本。
[1] "x86_64-apple-darwin13.4.0"
$arch
[1] "x86_64"
$os
[1] "darwin13.4.0"
$system
[1] "x86_64, darwin13.4.0"
$status
[1] ""
$major
[1] "3"
$minor
[1] "2.2"
$year
[1] "2015"
$month
[1] "08"
$day
[1] "14"
$`svn rev`
[1] "69053"
$language
[1] "R"
$version.string
[1] "R version 3.2.2 (2015-08-14)"
$nickname
[1] "Fire Safety"