例如,如果我有一个带有以下文本的文本文件(mytext.txt):
Table1
13 3 20 0 0 0 0
3 10 0 0 0 6 0
20 0 5 0 0 0 0
0 0 0 7 20 0 0
0 0 0 20 19 0 0
0 0 0 0 0 8 0
0 0 0 0 0 0 13
Table2
0
2
10
-5
3
-10
-5
我可以检索它们并获得两张桌子吗?
因此,如果我打印我的数据表1,我会得到第一个表,如果我打印我的数据表2,我会得到第二个表。
我知道如果mytext.txt只有一个表,我可以做类似的事情:
table1 <- read.table("mytext.txt")
答案 0 :(得分:2)
1)假设输入文件为tables.txt
,请将行读入Lines
并让names.ix
成为包含表名的行的索引 - - 这些行被标识为以不是减号或数字的字符开头。然后创建一个分组变量grp
,用于标识每行所属的表,将行拆分为这些组并读取每组行。这不使用任何包,可以处理文件中的任意数量的表。
Lines <- readLines("tables.txt")
names.ix <- grep("^[^-0-9]", Lines)
grp <- Lines[names.ix][ cumsum(seq_along(Lines) %in% names.ix) ]
Read <- function(x) read.table(text = x)
L <- lapply(split(Lines[-names.ix], grp[-names.ix]), Read)
,并提供:
> L
$Table1
V1 V2 V3 V4 V5 V6 V7
1 13 3 20 0 0 0 0
2 3 10 0 0 0 6 0
3 20 0 5 0 0 0 0
4 0 0 0 7 20 0 0
5 0 0 0 20 19 0 0
6 0 0 0 0 0 8 0
7 0 0 0 0 0 0 13
$Table2
V1
1 0
2 2
3 10
4 -5
5 3
6 -10
7 -5
2)顺便说一句,如果您只需要第一张表,那就可以了:
library(data.table)
fread("tables.txt")
答案 1 :(得分:1)
不是直接,但您可以在我的“SOfun”软件包available only on GitHub中尝试read.mtable
。
这种方法类似于@ G.Grothendieck的方法,但打包成一个函数,所以你可以简单地做:
read.mtable("tables.txt", chunkId = "Table", header = FALSE)
# $Table1
# V1 V2 V3 V4 V5 V6 V7
# 1 13 3 20 0 0 0 0
# 2 3 10 0 0 0 6 0
# 3 20 0 5 0 0 0 0
# 4 0 0 0 7 20 0 0
# 5 0 0 0 20 19 0 0
# 6 0 0 0 0 0 8 0
# 7 0 0 0 0 0 0 13
#
# $Table2
# V1
# 1 0
# 2 2
# 3 10
# 4 -5
# 5 3
# 6 -10
# 7 -5
chunkId
参数也可以是正则表达式,如`chunkId =“[A-Za-z] +”。