Question

这是一个我无法找到的更普遍的问题。我试图找到2个数据集之间的相关性，目标是将它们与特定的相关百分比进行匹配。它们不是完全匹配，但大多数在1％以内，但可能会有一些异常值。例如，每100个点可能会偏离5％，可能更多。

我也在尝试查找数据集可能与另一个数据集匹配但具有不同大小的实例。例如，如果您将所有数据乘以乘数，您将获得匹配。循环一大堆可能的乘数显然没有意义。我正在考虑将正斜率和负斜率匹配为+ 1 / -1，因为斜率不起作用。虽然，这在某些情况下不起作用，因为数据非常精细，因此它可能与数据的形状相匹配，但如果你放大斜率就会关闭。

R中是否有内置功能？我没有统计背景，我的搜索主要是如何处理单个数据集和异常值。

Answer 1

对于基本的Pearson，Spearman或Kendall相关，您可以使用cor（）函数：

x <- c(1, 2, 5, 7, 10, 15)
y <- c(2, 4, 6, 9, 12, 13)

cor(x, y, use="pairwise.complete.obs", method="pearson")

您可能希望根据数据调整“使用”和“方法”选项。由于您未提供数据的性质，因此我无法向您提供更具体的指导。

R中2个数据集之间相关性的统计函数

1 个答案: