我已经使用RPostgreSQL成功访问并使用R(rstudio)查询了amazon redshift
drv <- dbDriver("PostgreSQL")
con <- dbConnect(drv, host="****.redshift.amazonaws.com", port=5439,dbname="***", user="***", password="****")
然后我可以用:
运行我的查询dbGetQuery(con,"SELECT DISTINCT(vin) FROM rawdata")
虽然我的查询运行时间不长,但将文件保存到个人计算机上却可以。我认为将生成的.csv文件保存到Amazon S3存储桶会更快。我已经设置了一个。我只是不知道如何从R工作室做到这一点。
我已经能够使用SQL Workbench访问我的S3存储桶,代码为:
UNLOAD
('SELECT * FROM rawdata
ORDER BY timestamp')
TO 's3://data-**-**/file_name'
credentials '***'
delimiter ','
PARALLEL OFF
GZIP;
但我想在Rstudio(版本0.98.109)中执行类似的功能。有没有人可能有一个示例代码,可能有一个示例SQL查询?我可以在SQL工作台中运行它但我在其他代码中嵌入了SQl查询,我更喜欢在Rstudio中运行。
谢谢!