我正在尝试使用RODBC包中的sqlQuery函数从Impala数据库中获取一些数据。我得到的结果从查询的一次执行变为完全相同查询的另一次执行。
我获得的data.frame并不总是具有相同的行数:
Function testReplace(strInput As String) As String
testReplace = Join(Split(strInput, ":"), "") & "=" & Split(strInput, "=")(2)
End Function
此查询实际上应返回142561 x 220数据帧。
另一方面,以下查询始终返回相同(正确)的结果:
library("RODBC")
conn <- odbcConnect("Cloudera Impala DSN;host=mydb;port=21050")
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 26600 220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 142561 220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 23500 220
答案 0 :(得分:0)
似乎我的问题是Impala没有足够的内存来表现良好。