遍历大列表,找到与基因最合适的同源物

时间:2019-06-11 07:33:25

标签: r bioinformatics

我有大量的基因,我想查找其同源物。

我还有一个巨大的数据框,里面有潜在的同源物。 此数据框的第十列继承了一个数字,描述了拟合情况。数字越大越好。

我正试图遍历这个庞大的基因列表。

对于列表中的每个独特基因,我想选择最合适的同源基因。

输出应为每个基因一行的数据框,描述最合适的同源物。

1 个答案:

答案 0 :(得分:0)

Tidyverse解决方案,假设您有一个每个基因gene_id的列,而拟合得分在一个名为score的列中:

library(tidyverse)

df %>% group_by(gene_id) %>% filter(score == max(score)) %>% ungroup()