在某些情况下,人们更倾向于从plyr重塑ddply?我正在努力学习它们,它们看起来很相似

时间:2012-04-16 03:23:50

标签: r plyr reshape

似乎融化将使用id列和堆叠的测量变量重塑数据框,之后使用强制转换可以执行聚合。 ddply,从plyr包看起来非常相似..你给它一个数据框,一些用于分组的列变量,以及一个聚合函数,你得到一个数据框......那么它们是如何不同的并且在那里除了他们的文档之外,任何用于学习这些工具的好的资源/参考资料(特别是对于重塑,有点难以理解)

由于

1 个答案:

答案 0 :(得分:3)

一个区别是stats :: reshape有一种处理“宽”数据的内置方法,而reshape2(cast / melt)则没有。请参阅此问题以获取示例:Reshape in the middle

也就是说,stats :: reshape有令人沮丧的论据,只专注于一种类型的数据转换(尽管是常见的)。

倾向于使用plyr代替应用函数,而reshape2倾向于替代重塑。即使功能重叠,它们每个都适合于特定的任务。

reshape2和plyr软件包的作者Hadley Wickham在整洁的数据上有一个很好的pdf,值得一读。他还在这里发表了一篇关于plyr的文章:http://www.jstatsoft.org/v40/i01