我正在尝试使用summary来获取每个组的第一个结果,但是它返回的是列标题:
({get_table
是一个自定义函数,可从Postgres数据库获取数据表)
require(dplyr)
require(RPostgres)
tbl <- get_table(my_server, my_table) %>%
select(column_a, column_b) %>%
group_by(column_a) %>%
summarize(first_b = first(column_b))
结果看起来像
a first_b
1 "column_b"
2 "column_b"
3 "column_b"
如果我在dplyr::collect()
之前使用summarize()
,则会得到理想的结果,但这确实会降低性能。
有什么想法可以summarize
而不先使用collect
吗?