我想结合这两个信息,并使用电影标题名称将它们捆绑起来。这是第一个看起来像
的数据集structure(list(event_name = c("maze runner: the death cure", "star wars: the last jedi",
"spider-man: homecoming"), event_start_time = structure(c(100,
200, 300), class = "Date"), movie_sold_all = c(100L, 200L,
300L)), .Names = c("event_name", "event_start_time", "movie_sold_all"
), row.names = c(NA, 3L), class = "data.frame")
这是我抓取的第二个数据集
我期望得到的是加入movie_title
,以便他们将这两个信息合并。基本类似于SQL中的left join
我已尝试merge( df_bq_movies,movies,by.y="movie_title",all.x = TRUE)
但发生错误
Error in merge.data.frame(df_bq_movies, movies, by.y = "movie_title", :'by.x' and 'by.y' specify different numbers of columns
有关详细信息,这是数据集的维度
data 1 : 605 rows , 3 column
data 2 : 509 rows , 21 column
答案 0 :(得分:2)
使用合并时,如果两个数据集上的列名相同,则必须同时定义by.x
和by.y
,而只能使用by
。
e.g。
merge( df_bq_movies, movies, by.x = "event_name", by.y = "movie_title")