Question

我在表中有2列，分别是ID及其对应的序列（即TCGATCGA）。我想按ID对表进行分组，然后生成每个组中序列的所有可能配对。

对于分组部分，我正在使用df％>％group_by（IDs），但是在生成序列的所有可能配对时遇到了问题。

什么样的函数会更好地生成这些组合，最好是不必手动输入序列，因为我有1000多个？生成这些配对的最终目的是能够检查每个序列之间的相似性。

Answer 1

您可以只在同一列（向量）上使用扩展网格吗？

x <- c(1,2,3,4,5,6)
expand.grid(x, x)

如果您不想返回相同且重复的ID：

t(combn(x, 2))