Question

我有一个这样的数据框：

> head(ratData)
  Chromosome Start_Gene startPosition End_gene endPosition RNAtype strand           replicate
1      chr20        C4b       6382078      C4b     6381944     reg      - Thymus_M_GSM1328751
2       chr8       Rpl4      68832532     Rpl4    68832743     reg      + Thymus_M_GSM1328751
3       chr1       Dntt     267744370     Dntt   267746423     reg      + Thymus_M_GSM1328751
4      chr14     Sptbn1     114201107   Sptbn1   114200202     reg      - Thymus_M_GSM1328751
5      chr19     Ndufb7      35680273   Ndufb7    35683909     reg      + Thymus_M_GSM1328751
6      chr10    Ndufb10      13906408  Ndufb10    13906289     reg      - Thymus_M_GSM1328751

现在实际数据文件很大，大约有50-80个重复。现在我想做的是每次复制＆＃34; a＆＃34;制作一个名为＆＃34; a＆＃34;的子集数据框。因此，如果在列中复制，我们有＆＃34; a＆＃34;，＆＃34; b＆＃34;，＆＃34; c＆＃34;等，我想制作名称的子集数据帧＆＃34; a＆＃34;，＆＃34; b＆＃34;，＆＃34; c＆＃34;理想情况下，我想制作这个子集化数据框的列表/地图。

我有类似的人类数据文件，最终目标是使用for循环来比较人类的每个重复与每个大鼠的重复。我是 R 的新手，我完全不知道如何做到这一点。我正在考虑使用某种类型的地图/字典系统，如在C ++ / python中。但不确定它是否是处理它的正确方法。

非常感谢任何见解/帮助。

根据列中的不同复制名称子集数据框并动态命名子集

0 个答案: