读取.csv文件中的混合输出

时间:2014-01-19 20:39:20

标签: r

我正在尝试读取.csv文件的前1000行,但遇到了问题。 输出很混合。列比你预期的要少。

我做了以下的事情

data<-read.csv("myfile", header=T, sep=",", nrow=1000)

输出如下:

> data[1:10,]
   TranscriptId         GeneId.name. Mirna.Name.miRBase.version. miTG.score
1      F52F10.2   F52F10.2(F52F10.2)              cel-miR-62(33)      0.488
2          UTR3    V:1550484-1550512         0.00994712053496221         NA
3      F11A1.3a      F11A1.3(daf-12)              cel-miR-62(33)      0.702
4          UTR3  X:10665625-10665653          0.0247451317964074         NA
5      T11G6.5a     T11G6.5(T11G6.5)              cel-miR-62(33)      0.511
6           CDS IV:10841175-10841203           0.022290972286146         NA
7           CDS IV:10840760-10840788          0.0110658552017645         NA
8       F28H6.4     F28H6.4(F28H6.4)              cel-miR-62(33)      0.494
9          UTR3  X:14133330-14133358         0.00425015346910806         NA
10          CDS  X:14128414-14128442          0.0140299826282741         NA

我希望 UTR CDS 成为我的名字。 在其他世界中,我如何重新排列信息并将其放入矩阵中,如下所示? (我这里只写了一行矩阵)

> data[1:1,]
   TranscriptId         GeneId.name.    Mirna.Name.miRBase.version.    miTG.score         UTR3           se
1      F52F10.2   F52F10.2(F52F10.2)              cel-miR-62(33)      0.488   V:1550484-1550512  0.00994712053496221

对于多个CDS和UTR3,我们将在每个记录中取得得分最高的一个(第3列)。

0 个答案:

没有答案