确定降低R中相关系数的行

时间:2018-10-26 18:00:47

标签: r statistics data-science coefficients

有一个数据集,该数据集包含以下三列和几千行。两列(销售和订单)的相关系数为0.68。

in

如何获取100行(可能是异常值)对降低相关系数起最大作用的列表。

1 个答案:

答案 0 :(得分:4)

我称您的数据框为“ emp”。

lm()将产生影响度量,您可以使用其中的任何一个,例如库克的D,以选择分歧最大的线。

m1<-lm(sales~orders,data=emp)
im<-as.data.frame(influence.measures(m1)$infmat)
im[order(im$cook.d,decreasing=T),][1:100,]