我有一个巨大的数据框,看起来像:
Gene | Treatment | Control
A1CF| 6.643735| 6.065211
A1CF| 8.122326| 7.443722
A1CF| 6.247434| 5.647067
A1CF| 5.311160| 5.432942
A1CF| 6.048126| 6.805895
A1CF| 5.414253| 5.583502
A1CF| 7.143737| 4.719824
A1CF| 7.071972| 6.876549
A1CF| 4.079834| 6.725724
A1CF| 6.085052| 5.128936
ABCB1| 8.184414| 7.454422
ABCB1| 7.168527| 5.343675
ABCB1| 8.195312| 7.897611
ABCB1| 8.348520| 7.894995
ABCB1| 4.380701| 6.256692
ABCB1| 4.141235| 7.065211
ABCB1| 7.352853| 6.983843
ABCB1| 5.896122| 6.256692
ABCB1| 6.537364| 6.523796
ABCB1| 6.156185| 7.120003
然后读取约8000个数据。
对于此数据框,我有2个不同的问题:
1)我想选择一个基因名称和相应的“治疗值”,然后仅将治疗值粘贴到新列中,同时删除正在治疗的值。即选择ABCB1基因和相应的处理值,然后将其粘贴到名为“ ABCB1”的新列下。但是在执行此操作时,我不希望ABCB1处理值从第一行开始。数据仍应对应于ABCB1,但仅在另一列下。
2)在10:20之间选择“治疗”列值,然后剪切这些值并将其粘贴到名为“ ABCB1”的新列中。
最好的问候。
我已经尝试将dplyr
和mutate()
的软件包transmute()
与包一起使用,但无法成功。