我约。 75k数据集。包含数据的文件包含两列:一列包含event_id
,第二列包含prices
。(价格是一些实数)我可以找到价格的模式(最常见的价值)对于每个event_id
。我一直试图使用这个命令来做到这一点:
aggregate(price~event_id,data=bets,FUN="mode")
但每个event_id
的值为numeric
。我不知道numeric
的含义是什么。你有没有?或者你知道找到这种数据集模式的其他方法吗?
由于
答案 0 :(得分:1)
mode_fun <- function(x) {
mode0 <- names(which.max(table(x)))
if(is.numeric(x)) return(as.numeric(mode0))
mode0
}
aggregate(price~event_id,data=bets,FUN=mode_fun)