我在两个数据帧上执行条件操作时遇到一些困难。对于问题说明,我有三个变量:Price,State和Item,它们存储在具有这些列名的数据框(data1)中。我使用ddply生成一个数据框(data2),其中包括State和Item列,以及该State / Item组合的平均价格(或其他一些函数)。
我当时想要做的是填写原始数据框中的一列(即一个简单的预测向量),其中列的值是data1中State和Item的给定观察组合的平均值。 (例如,如果data1中的观察具有 state =“Arizona”和 item =“pen”,那么我想要检索存储在data2中的平均价格,该平均价格与状态/项目组合,并将其插入列中。)
感谢您的帮助。
答案 0 :(得分:1)
plyr包附带了一个名为join
的小功能。您可以使用它来完成任务。
join(dat1,dat2, by=c('State','Item'))
查看?join以查看可能的不同类型的连接。我很确定你想要left
加入。