我有一个包含一些csv数据和一些文本信息的文件。 该文件包含以下数据:
name:russel date:21-2-1991
abc,2,saa
anan,3,ds
ama,ds,az
,,
name:rus date:23-3-1998
snans,32,asa
asa,2,saz
由于它包含一些额外的文本信息,我无法使用R中的read.csv()方法读取该文件。所以我使用
读取该文件text <- readLines("samplepf.csv")
lines <- scan(text = text, what = character())
现在我想从字符数组“lines”中删除所有不需要的信息。我只想要csv格式的数据。 我需要用什么代码来快速检查所有数据?
答案 0 :(得分:1)
由于你的其他行没有,
,我会做这样的事情:
tt <- readLines("my_file")
tt.con <- textConnection(tt[grepl(",", tt)])
my.dat <- read.table(tt.con, , sep=",")
close(tt.con)
> my.dat
# V1 V2 V3
# 1 abc 2 saa
# 2 anan 3 ds
# 3 ama ds az
# 4
# 5 snans 32 asa
# 6 asa 2 saz