在r中导入没有一致模式的txt文件

时间:2018-05-14 20:27:39

标签: r

我有一个如下所示的txt文件:

'111001', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '12:14:03'
Don't drop out of school.
'121002', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '14:04:13'
he should finish his degree!

在文件中,一个条目被分成两行。例如,第一个条目应如下所示:

'111001', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '12:14:03', 'Don't drop out of school.'

然后我想将文件导入R,每个引用的内容应该是一个单元格。例如,第一行应如下所示:

 111001 1 C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp default.mlp 10/3/2017 12:14:03 Don't drop out of school

在上面的示例中,111001,1,C:\ Users \ dicelab \ Desktop \ mar \ ExPart1_C1.exp等是分开的,每个都占用一列。

1 个答案:

答案 0 :(得分:2)

如果每一行恰好占用两行,那么您可以将文件拆分为csv部分和非csv部分。例如

lines <- readLines("2row.txt")
dd <- read.csv(text=lines[seq(1, length(lines), by=2)], header=F)
dd$comments = lines[seq(2, length(lines), by=2)]

在这里,我们将奇数行分组并将它们发送到read.csv,然后我们只是将偶数行粘贴为列。