R如何删除列中的重复元素并获得平均值

时间:2014-05-19 13:39:47

标签: r

对不起我是R的新手,问题对我来说很难,
这是矩阵:

        V1              predictions
1   Jeffery Howes   0.0909596345057677
2   Sherilee Waring 0.00434589236424605
3   Rachel Maitland 0.0909596345057677
4   Jan Maitland    0.0909596345057677
5   Jan Maitland    0.0909596345057677
6   Jan Maitland    0.0909596345057677
7   Jan Maitland    0.0909596345057677
8   Sandra McEwen   0.0909596345057677
....  

如何删除列中的重复项(对我来说没问题,可以使用唯一的,但以下问题对我来说很难)。

例如,有许多重复名称Jan Maitland,应删除重复项,但应计算预测值(最终结果应为这些重复名称的平均值)

有人可以帮助我吗?非常感谢!!

1 个答案:

答案 0 :(得分:1)

您可以使用dplyr库:

result%.%group_by(V1)%.%summarise(predictions = mean(predictions))
# the 2nd syntax
summarise(group_by(result, V1), predictions=mean(predictions))

HTH