根据列中的不同复制名称子集数据框并动态命名子集

时间:2014-08-05 09:21:00

标签: r dataframe subset

我有一个这样的数据框:

> head(ratData)
  Chromosome Start_Gene startPosition End_gene endPosition RNAtype strand           replicate
1      chr20        C4b       6382078      C4b     6381944     reg      - Thymus_M_GSM1328751
2       chr8       Rpl4      68832532     Rpl4    68832743     reg      + Thymus_M_GSM1328751
3       chr1       Dntt     267744370     Dntt   267746423     reg      + Thymus_M_GSM1328751
4      chr14     Sptbn1     114201107   Sptbn1   114200202     reg      - Thymus_M_GSM1328751
5      chr19     Ndufb7      35680273   Ndufb7    35683909     reg      + Thymus_M_GSM1328751
6      chr10    Ndufb10      13906408  Ndufb10    13906289     reg      - Thymus_M_GSM1328751

现在实际数据文件很大,大约有50-80个重复。现在我想做的是每次复制" a"制作一个名为" a"的子集数据框。因此,如果在列中复制,我们有" a"," b"," c"等,我想制作名称的子集数据帧" a"," b"," c"理想情况下,我想制作这个子集化数据框的列表/地图。

我有类似的人类数据文件,最终目标是使用for循环来比较人类的每个重复与每个大鼠的重复。我是 R 的新手,我完全不知道如何做到这一点。我正在考虑使用某种类型的地图/字典系统,如在C ++ / python中。但不确定它是否是处理它的正确方法。

非常感谢任何见解/帮助。

0 个答案:

没有答案