为什么来自RODBC的sqlQuery在查询Impala数据库时并不总是返回相同的数据?

时间:2016-05-26 08:07:01

标签: r impala rodbc

我正在尝试使用RODBC包中的sqlQuery函数从Impala数据库中获取一些数据。我得到的结果从查询的一次执行变为完全相同查询的另一次执行。

我获得的data.frame并不总是具有相同的行数:

Function testReplace(strInput As String) As String

testReplace = Join(Split(strInput, ":"), "") & "=" & Split(strInput, "=")(2)

End Function

此查询实际上应返回142561 x 220数据帧。

另一方面,以下查询始终返回相同(正确)的结果:

library("RODBC")
conn <- odbcConnect("Cloudera Impala DSN;host=mydb;port=21050")    
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 26600   220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 142561   220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 23500   220

1 个答案:

答案 0 :(得分:0)

似乎我的问题是Impala没有足够的内存来表现良好。