我在表中有2列,分别是ID及其对应的序列(即TCGATCGA)。我想按ID对表进行分组,然后生成每个组中序列的所有可能配对。
对于分组部分,我正在使用df%>%group_by(IDs),但是在生成序列的所有可能配对时遇到了问题。
什么样的函数会更好地生成这些组合,最好是不必手动输入序列,因为我有1000多个?生成这些配对的最终目的是能够检查每个序列之间的相似性。
答案 0 :(得分:1)
您可以只在同一列(向量)上使用扩展网格吗?
x <- c(1,2,3,4,5,6)
expand.grid(x, x)
如果您不想返回相同且重复的ID:
t(combn(x, 2))