我正在尝试读取.csv文件的前1000行,但遇到了问题。 输出很混合。列比你预期的要少。
我做了以下的事情
data<-read.csv("myfile", header=T, sep=",", nrow=1000)
输出如下:
> data[1:10,]
TranscriptId GeneId.name. Mirna.Name.miRBase.version. miTG.score
1 F52F10.2 F52F10.2(F52F10.2) cel-miR-62(33) 0.488
2 UTR3 V:1550484-1550512 0.00994712053496221 NA
3 F11A1.3a F11A1.3(daf-12) cel-miR-62(33) 0.702
4 UTR3 X:10665625-10665653 0.0247451317964074 NA
5 T11G6.5a T11G6.5(T11G6.5) cel-miR-62(33) 0.511
6 CDS IV:10841175-10841203 0.022290972286146 NA
7 CDS IV:10840760-10840788 0.0110658552017645 NA
8 F28H6.4 F28H6.4(F28H6.4) cel-miR-62(33) 0.494
9 UTR3 X:14133330-14133358 0.00425015346910806 NA
10 CDS X:14128414-14128442 0.0140299826282741 NA
我希望 UTR 和 CDS 成为我的名字。 在其他世界中,我如何重新排列信息并将其放入矩阵中,如下所示? (我这里只写了一行矩阵)
> data[1:1,]
TranscriptId GeneId.name. Mirna.Name.miRBase.version. miTG.score UTR3 se
1 F52F10.2 F52F10.2(F52F10.2) cel-miR-62(33) 0.488 V:1550484-1550512 0.00994712053496221
对于多个CDS和UTR3,我们将在每个记录中取得得分最高的一个(第3列)。