将列添加到sqlite数据库

时间:2017-05-14 19:24:17

标签: r dplyr r-dbi rsqlite dbplyr

我正在尝试将我在R中生成的向量添加到sqlite表中作为新列。为此,我想使用dplyr(我根据此帖here安装了最新的开发版和dbplyr包。我尝试了什么:

library(dplyr)
library(DBI) 

#creating initial database and table
dbcon      <- dbConnect(RSQLite::SQLite(), "cars.db") 
dbWriteTable(dbcon, name = "cars", value = cars)
cars_tbl <- dplyr::tbl(dbcon, "cars")

#new values which I want to add as a new column 
new_values <- sample(c("A","B","C"), nrow(cars), replace = TRUE) 

#attempt to add new values as column to the table in the database
cars_tbl %>% mutate(new_col = new_values) #not working

实现这一目标的简单方法是什么(不一定是dplyr)?

1 个答案:

答案 0 :(得分:4)

不知道使用dyplr执行此操作的方法,但您可以直接使用RSQLite执行此操作。问题实际上并不在RSQLite,而在于我不知道如何将列表传递给mutate。请注意,在您的代码中,类似这样的东西可以工作:

cars_tbl %>% mutate(new_col = another_column / 3.14)

无论如何,我的另类。我创建了一个玩具cars数据框。

cars <- data.frame(year=c(1999, 2007, 2009, 2017), model=c("Ford", "Toyota", "Toyota", "BMW"))

我打开连接并实际创建表,

dbcon <- dbConnect(RSQLite::SQLite(), "cars.db")
dbWriteTable(dbcon, name = "cars", value = cars)

添加新列并检查

dbGetQuery(dbcon, "ALTER TABLE cars ADD COLUMN new_col TEXT")
dbGetQuery(dbcon, "SELECT * FROM cars")
  year  model new_col
1 1999   Ford    <NA>
2 2007 Toyota    <NA>
3 2009 Toyota    <NA>
4 2017    BMW    <NA>

然后您可以更新新列,但唯一棘手的是您必须提供where语句,在这种情况下我使用年份。

new_values <- sample(c("A","B","C"), nrow(cars), replace = TRUE) 
new_values
[1] "C" "B" "B" "B"

dbGetPreparedQuery(dbcon, "UPDATE cars SET new_col = ? where year=?",
                   bind.data=data.frame(new_col=new_values,
                                        year=cars$year))

dbGetQuery(dbcon, "SELECT * FROM cars")
  year  model new_col
1 1999   Ford       C
2 2007 Toyota       B
3 2009 Toyota       B
4 2017    BMW       B

作为唯一索引,您始终可以使用rownames(cars),但您必须将其添加为数据框中的列,然后添加到表格中。

@krlmlr建议后编辑:使用dbExecute代替弃用dbGetPreparedQuery确实好得多,

dbExecute(dbcon, "UPDATE cars SET new_col = :new_col where year = :year",
          params=data.frame(new_col=new_values,
                            year=cars$year))

评论后编辑:几天前我没有想到这一点,但即使是SQLite,您也可以使用rowid。我已对此进行了测试,但确实有效。

dbExecute(dbcon, "UPDATE cars SET new_col = :new_col where rowid = :id",
          params=data.frame(new_col=new_values,
                            id=rownames(cars)))

虽然您必须确保表格中的rowid与您的rownames相同。无论如何,你可以随时得到你的rowid:

dbGetQuery(dbcon, "SELECT rowid, * FROM cars")
  rowid year  model new_col
1     1 1999   Ford       C
2     2 2007 Toyota       B
3     3 2009 Toyota       B
4     4 2017    BMW       B