我是否可以仅使用R中的dplyr语法运行SQL更新语句

时间:2017-07-17 16:15:55

标签: r dplyr rstudio rpostgresql r-dbi

我需要更新某些PostgreSQL数据库表中其他列的条件值。我设法在R中编写SQL语句并使用dbExecute包中的DBI执行它。

library(dplyr)
library(DBI)

# Establish connection with database
con <- dbConnect(RPostgreSQL::PostgreSQL(), dbname = "myDb",
                 host="localhost", port= 5432, user="me",password = myPwd)

# Write SQL update statement
request <- paste("UPDATE table_to_update",
                 "SET var_to_change = 'new value' ",
                 "WHERE filter_var = 'filter' ")

# Back-end execution
con %>% dbExecute(request)

是否可以仅使用dplyr语法执行此操作?出于好奇,我试过了,

con %>% tbl("table_to_update") %>%
   mutate(var_to_change = if (filter_var == 'filter') 'new value' else var_to_change)

在R中工作,但在db中显然没有任何作用,因为它使用select语句。 copy_to只允许使用appendoverwite个选项,因此我无法看到如何使用它,除非删除然后附加已过滤的观察结果...

1 个答案:

答案 0 :(得分:4)

当前的dplyr 0.7.1(使用dbplyr 1.1.0)不支持此功能,因为它假定所有数据源都是不可变的。通过UPDATE发出dbExecute()似乎是最好的选择。

要替换表格中较大的块,您还可以:

  1. 通过copy_to()将数据框写入数据库中的临时表。
  2. 开始交易。
  3. 发出DELETE FROM ... WHERE id IN (SELECT id FROM <temporary table>)
  4. 发出INSERT INTO ... SELECT * FROM <temporary table>
  5. 提交交易
  6. 根据您的架构,您可以执行单个INSERT INTO ... ON CONFLICT DO UPDATE而不是DELETE,然后INSERT