我有一个包含六列的大型数据集(称为A,B,C,D,E,F),大约450,000行。我只是试图找到列A
和B
之间的相关性:
cor(A, B)
我得到了
结果是[1] NA
。我该怎么做才能解决这个问题?
答案 0 :(得分:13)
试试cor(A,B, use = "pairwise.complete.obs")
。这将忽略观察中的NA。
要在统计上严谨,您还应该查看数据中缺少的条目数,并查看随机假设中的缺失是否成立。
修改1:查看?cor
以查看use
参数的其他选项。
答案 1 :(得分:4)