从R

时间:2015-10-21 15:10:43

标签: r matrix dataframe contingency

我有一个包含两个变量的大数据框,其中一个是名称,另一个是与这些名称相关的人的id号,我想创建一个矩阵,其中每个名称都是一个观察,每个id都是一个变量。 / p>

例如

names     ids
peter     23
peter     20
peter     25
john      25
john      22
mike      21

我想获得一个矩阵

names      20     21     22     23

peter      1      0      0      1

问题是我有38210个观测值,我在这里尝试了很多类似答案的解决方案,并且R崩溃并且计算机冻结或者我获得了一个包含291444个变量的表(使用as.data.frame.matrix)没有意义,因为原始表中的变量不能超过观察值。

有什么想法吗?谢谢!

1 个答案:

答案 0 :(得分:0)

我们可以使用table

 +(table(df1)!=0)