我想对许多数据框进行关联

时间:2015-05-10 18:31:58

标签: r function loops correlation

我有近13个文件,我想对它进行三种类型的相关。 除了值之外,所有文件都具有相同的内容。

例如:

v1 v2 v3 v4 v5 v6 v7 v8 ........... v50

v6和v20之间的第一次纠正 v7和v21之间的第二个相关性 v8和v22之间的第三个相关

我的数据缺少值。

为每个文件手动执行将导致一个太长的脚本,我想为所有文件做一个循环函数(不幸的是我不是循环函数的专家,我尝试了很多)我需要帮助

1 个答案:

答案 0 :(得分:1)

如果'd1','d2',...'d13'是数据集,且列的顺序相同,我们可以将数据集放在list中并获取{{1}对于指定的列。 cor中有选项可以在存在缺失值的情况下计算协方差。在这里,我使用了?cor。我们可以根据需要改变它。

na.or.complete

最好直接将文件读入lapply(mget(paste0('d', 1:13)), function(x) diag(cor(x[,6:8], x[,20:22], use='na.or.complete'))) ,而不是在全局环境中创建单个list对象。假设文件都在工作目录中。

data.frame