我有一个这样的数据框:
> head(ratData)
Chromosome Start_Gene startPosition End_gene endPosition RNAtype strand replicate
1 chr20 C4b 6382078 C4b 6381944 reg - Thymus_M_GSM1328751
2 chr8 Rpl4 68832532 Rpl4 68832743 reg + Thymus_M_GSM1328751
3 chr1 Dntt 267744370 Dntt 267746423 reg + Thymus_M_GSM1328751
4 chr14 Sptbn1 114201107 Sptbn1 114200202 reg - Thymus_M_GSM1328751
5 chr19 Ndufb7 35680273 Ndufb7 35683909 reg + Thymus_M_GSM1328751
6 chr10 Ndufb10 13906408 Ndufb10 13906289 reg - Thymus_M_GSM1328751
现在实际数据文件很大,大约有50-80个重复。现在我想做的是每次复制" a"制作一个名为" a"的子集数据框。因此,如果在列中复制,我们有" a"," b"," c"等,我想制作名称的子集数据帧" a"," b"," c"理想情况下,我想制作这个子集化数据框的列表/地图。
我有类似的人类数据文件,最终目标是使用for循环来比较人类的每个重复与每个大鼠的重复。我是 R 的新手,我完全不知道如何做到这一点。我正在考虑使用某种类型的地图/字典系统,如在C ++ / python中。但不确定它是否是处理它的正确方法。
非常感谢任何见解/帮助。