使用reg ex跳过读取文件的行

时间:2016-07-26 17:02:27

标签: r read.csv

我有类似内容的文件

!software version: $Revision$
!date: 07/06/2016 $ 
!
! from Mouse Genome Database (MGD) & Gene Expression Database (GXD)
!
MGI

我正在使用read.csv来读取文件。但我需要跳过“!”的行。在一开始的时候。我怎么能这样做?

2 个答案:

答案 0 :(得分:2)

它所基于的read.csv函数和read.table有一个名为comment.char的参数,可用于指定一个字符,如果看到它将忽略该行的其余部分。设置为“!”可能足以做你想做的事。

如果你真的需要正则表达式,那么最好的方法是使用readLines(或类似函数)读取文件,然后将正则表达式应用于生成的字符串向量以删除不需要的元素( ()),然后将结果传递给text参数read.table(或使用文本连接)。

答案 1 :(得分:0)

计算不以!开头的第一行

to_skip <- min(grep('^[^!]', trimws(readLines('file.csv'))))

df <- read.csv('file.csv', skip = to_skip)