对于数据库和Redshift来说都是较新的东西,我想使用R Studio中的 Connections 来查询一组数据库以提取数据的子集。
特定问题:在Redshift中连接到正确的数据库后,如何使用dbplyr
指定子数据库及其表?
主数据库是production
,其中有几个子数据库(?),例如customerdb
,supplierdb
,membersdb
..有几张桌子。假设我想在companies
中将表customerdb
的数据子集化,我正在尝试通过以下方式做到这一点:
# `con` is the connection to Redshift database via DBI and it connects successfully
dataset <- tbl(con, "customerdb.companies")
Error in new_result(connection@ptr, statement) :
nanodbc/nanodbc.cpp:1344: 42P01: [Amazon][Amazon Redshift] (30)
Error occurred while trying to execute a query: [SQLState 42P01]
ERROR: relation "customerdb.companies" does not exist
已经查看了从AWS到dbplyr的页面的各种资源,以及其他SO问题,并且似乎都没有显示这种设置样式或方法来连接到基础表。