我有一个名为data_devoir_grp
的数据帧,其中包含电影统计信息,我必须找到最昂贵的电影的主要演员。输出必须是主要演员的姓名,以及电影的预算金额。在我的数据帧中,有一列“预算”显示每部电影的成本,一列“ actor_1_name”显示每部电影的主要演员名称。
这就是我为了了解最昂贵的电影而尝试过的:
aggregate(data_devoir_grp, by = list(data_devoir_grp$budget), FUN = max)
summary(budget,data = data_devoir_grp, fun = max(x))
max(data_devoir_grp$budget)
但是这些都不起作用。你有什么主意吗 ?
谢谢!
答案 0 :(得分:1)
这是使用dplyr库的一种方法。不过,您需要先确保数据框的预算字段为数字。
data_devoir_grp$budget <- as.numeric(levels(data_devoir_grp$budget))[data_devoir_grp$budget]
library(dplyr)
tmp <- data_devoir_grp %>%
filter(budget == max(budget)) %>%
select(actor_1_name, budget)
答案 1 :(得分:1)
您尝试过吗:
data_devoir_grp[data_devoir_grp$budget == max(data_devoir_grp$budget),'actor_1_name']