Question

我有大量的基因，我想查找其同源物。

我还有一个巨大的数据框，里面有潜在的同源物。此数据框的第十列继承了一个数字，描述了拟合情况。数字越大越好。

我正试图遍历这个庞大的基因列表。

对于列表中的每个独特基因，我想选择最合适的同源基因。

输出应为每个基因一行的数据框，描述最合适的同源物。

Answer 1

Tidyverse解决方案，假设您有一个每个基因gene_id的列，而拟合得分在一个名为score的列中：

library(tidyverse)

df %>% group_by(gene_id) %>% filter(score == max(score)) %>% ungroup()