我有34个带有一堆变量的子集,我正在创建一个新的数据框,其中汇总了有关子集的每个变量的信息。 - 示例:A10,T2和V2都是具有~10个变量和14个观察值的子集,其中一个变量是总体。
我希望我的新数据框有一个列,表示每个子集变量2达到零的次数。
我查看了一堆不同的计数函数,但它们似乎都在制作单独的表并计算所有变量的出现次数。我对每个唯一值出现的次数不感兴趣,因为大多数值都是唯一的,我只想知道14次观测的每个子集的人口数达到零的次数。
我意识到这可能是一件简单的事情,但我还不擅长从其他R代码创建我自己的解决方案。谢谢你的帮助。
我已经使用不同的数据集做了类似的事情,其中我计算了在所有其他值都是数值的向量中出现“NA”的次数。为此我用过:
na.tmin<- c(sum(is.na(s1997$TMIN)), sum(is.na(s1998$TMIN)), sum(is.na(s1999$TMIN))...
创建了一个列(na.tmin),其中每个子集记录的次数为NA而不是数字。我想计算值0出现的次数,但是当然不是函数,因为0是数字。是否有一个函数只计算特定值出现的次数?如果我不应该使用唯一值函数的计数出现次数?
答案 0 :(得分:0)
也许:
sum( abs( s1997$TMIN ) < 0.00000001 )
使用公差值更安全,除非您确定您的值是整数。见FAQ 7.31。
sum( abs( pi - (355/113+seq(-0.001, 0.001, length=1000 ) ) )< 0.00001 )
[1] 10