我有大量的基因,我想查找其同源物。
我还有一个巨大的数据框,里面有潜在的同源物。 此数据框的第十列继承了一个数字,描述了拟合情况。数字越大越好。
我正试图遍历这个庞大的基因列表。
对于列表中的每个独特基因,我想选择最合适的同源基因。
输出应为每个基因一行的数据框,描述最合适的同源物。
答案 0 :(得分:0)
Tidyverse解决方案,假设您有一个每个基因gene_id
的列,而拟合得分在一个名为score
的列中:
library(tidyverse)
df %>% group_by(gene_id) %>% filter(score == max(score)) %>% ungroup()