如何在R中的数据集中的列内生成所有可能的配对?

时间:2019-06-28 20:58:20

标签: r

我在表中有2列,分别是ID及其对应的序列(即TCGATCGA)。我想按ID对表进行分组,然后生成每个组中序列的所有可能配对。

对于分组部分,我正在使用df%>%group_by(IDs),但是在生成序列的所有可能配对时遇到了问题。

什么样的函数会更好地生成这些组合,最好是不必手动输入序列,因为我有1000多个?生成这些配对的最终目的是能够检查每个序列之间的相似性。

1 个答案:

答案 0 :(得分:1)

您可以只在同一列(向量)上使用扩展网格吗?

x <- c(1,2,3,4,5,6)
expand.grid(x, x)

如果您不想返回相同且重复的ID:

t(combn(x, 2))