稍微偏离主题的问题,但我想知道是否有人能告诉我最近何时以及如何改进cor()功能?它比我记忆的要快得多,现在速度与HMisc包中的rcorr函数相当,后者是我对大型矩阵的替代相关函数。
感谢所有建议: 经过一些调查,速度的差异是由于使用use =“pairwise”标志而不是算法变化。使用此选项时,速度差异约为8倍。
版本2.4 - 2.13中R上cor()的速度是可比较的。
谢谢,
伊恩
答案 0 :(得分:5)
http://cran.r-project.org/src/base/NEWS.html概述了最近的变化,并对其相关性进行了解释。这有时可用于获取可能影响您正在执行的操作的其他功能中的相关更改。 cor()
的快速查找仅显示了一些内容:
2.13.0
使用=(complete.obs)的cor()和cov()的等级相关方法在删除缺失值之前计算了等级,而文档暗示不完整的案例首先被删除。 (https://bugs.R-project.org/bugzilla3/show_bug.cgi?id=14488PR#14488)
2.11.0
cor()和cov()现在测试是否误用非数字参数,例如非错误报告https://bugs.R-project.org/bugzilla3/show_bug.cgi?id=14207PR#14207。
答案 1 :(得分:3)
很难说不知道你正在运行什么版本,但看起来2.14中会有一些实质性的变化,只有2.13和之前版本之间的微小变化回到至少2.10。比较这些以查看2.14中的当前变化:
2.13代码: https://svn.r-project.org/R/branches/R-2-13-branch/src/main/cov.c
2.14代码: https://svn.r-project.org/R/branches/R-2-14-branch/src/main/cov.c