亚马逊S3桶与Rstudio访问

时间:2014-12-02 21:10:27

标签: r amazon-s3 amazon-redshift

我已经使用RPostgreSQL成功访问并使用R(rstudio)查询了amazon redshift

drv <- dbDriver("PostgreSQL")
con <- dbConnect(drv, host="****.redshift.amazonaws.com", port=5439,dbname="***", user="***", password="****")

然后我可以用:

运行我的查询
dbGetQuery(con,"SELECT DISTINCT(vin) FROM rawdata")

虽然我的查询运行时间不长,但将文件保存到个人计算机上却可以。我认为将生成的.csv文件保存到Amazon S3存储桶会更快。我已经设置了一个。我只是不知道如何从R工作室做到这一点。

我已经能够使用SQL Workbench访问我的S3存储桶,代码为:

UNLOAD
('SELECT * FROM rawdata
ORDER BY timestamp')
TO 's3://data-**-**/file_name'
credentials '***'
delimiter ','
PARALLEL OFF
GZIP;

但我想在Rstudio(版本0.98.109)中执行类似的功能。有没有人可能有一个示例代码,可能有一个示例SQL查询?我可以在SQL工作台中运行它但我在其他代码中嵌入了SQl查询,我更喜欢在Rstudio中运行。

谢谢!

1 个答案:

答案 0 :(得分:0)

有些软件包可以帮助你,不是在CRAN中,但值得尝试:

Ex:https://github.com/armstrtw/AWS.tools