从列表中提取数据 - 找到最高值

时间:2014-01-20 04:24:16

标签: r dataframe

我创建了一个table并将其设置为数据框。前四个变量是因素,而后四个(票价,税,通,净)是数字。我需要找到哪个TA(旅行社)卖得最多。如何在最大结果上打印名称?例如:3300,支付更多。另外,在这个表中我有两个变量(3300和3303),票数最高(4)是R选择第一个最高变量吗?我能展示所有结果吗?含义:3300支付更多4 3303支付票4。

Example table

1 个答案:

答案 0 :(得分:0)

我假设IATA是票务代理变量:

df = data.frame(IATA=c(3300, 3300, 3300, 3300, 3301, 3301, 3302, 3303, 3303))
table(df$IATA)
# 3300 3301 3302 3303 
#    4    2    1    2 

如您所见,table给出了每个票务代理的票务销售频率。

names(which.max(table(df$IATA)))
# [1] "3300"

如果有关系并且你需要所有关系,请尝试:

df = data.frame(IATA=c(3300, 3300, 3300, 3300, 3301, 3301, 3302, 3303, 3303, 3303, 3303))
names(which(table(df$IATA) == max(table(df$IATA))))
# [1] "3300" "3303"