读取文件时异常值

时间:2016-05-03 06:11:03

标签: read.table

我用unix [wc -l]检查了输入行的数量,它是578537.但是,当我在R中读取这个文件时,我得到658926.我检查了R输出,并且有输出像' XN:I:0'在某些方面。所以我想知道这是什么以及我是如何在R中得到它的?它与正则表达式有关吗?想更多地了解这个主题,以了解read.table之后这些值是如何出现的。

f=read.table("file.sam", sep="\t", skip=3, quote ="", fill=T, comment.char = "")[,c(1,10,11)]    
# I need values of 1st, 10th and 11th column, and some lines have less values than others; skip 3 is for skipping SAM header

虚拟输出

M00547:13:00:20456 TGTTTCTGTA //99009
M00547:13:00:25175 AGACTAATTA hegffghg
XN:i:0
M00547:13:00:10803 TTATTATGTT 09;;00..

0 个答案:

没有答案