如何在R中使用grep函数来根据样本名称查找相关性

时间:2018-05-25 16:15:02

标签: r

我有两个数据框,其中包含有关基因的信息。这两个数据帧都具有相同的尺寸(20,000行×50列)。我有另一个名为info的文件包含这些数据框之间匹配的主题名称。我想从文件(信息)grep名称,以找到匹配的主题之间的相关系数。这是这些文件的示例:

df1
gene_name    loc1  loc2 .........  loc50
gene1        1        23              25
gene2        24       15              67

df2
gene_name    loc1  loc2 .........  loc50
gene1        21       31              55
gene2        2       65              89

info file
subject     loc_in_df1   loc_in_df2
1                loc1          loc2
2                loc3          loc46   

1 个答案:

答案 0 :(得分:0)

尝试类似下面的内容

首先根据信息文件<{1}}和df建立df1列,

df2

df <- cbind(df1[, info$loc_in_df1],df2[, info$loc_in_df2]) 

1:50和51:100假设您的信息文件中有50个配对,但它只是猜测,因为您没有提供可重复的样本