我有一个第一行是标题的文件。标题可以包含空格和#符号(也可能有其他特殊字符)。我试图使用read.csv或read.table读取此文件,但它一直让我犯错:
undefined columns selected
more columns than column names
我的制表符分隔的chromFile文件如下所示:
Chromosome# Chr chr Size UCSC NCBI36/hg18 NCBIBuild36 NCBIBuild37
1 Chr1 chr1 247199719 247249719 247249719 249250621
2 Chr2 chr2 242751149 242951149 242951149 243199373
命令:
chromosomes <- read.csv(chromFile, sep="\t",skip =0, header = TRUE, )
我想首先寻找一种方法来读取文件,而不用替换空格或#和其他可读符号。
答案 0 :(得分:35)
来自文档(?read.csv
):
comment.char 字符:长度为1的字符向量,包含单个字符或空字符串。使用&#34;&#34;完全关闭评论的解释。
默认为comment.char = "#"
,这会给您带来麻烦。在文档之后,您应该使用comment.char = ""
。
标题中的空格是另一个问题,正如mrdwab所指出的那样,可以通过设置check.names = FALSE
来解决。
chromosomes <- read.csv(chromFile, sep = "\t", skip = 0, header = TRUE,
comment.char = "", check.names = FALSE)