是否可以从同一文本文件中读取两个表?

时间:2015-03-26 18:47:44

标签: r text-files read.table

例如,如果我有一个带有以下文本的文本文件(mytext.txt):

Table1

    13  3   20  0   0   0   0
    3   10  0   0   0   6   0
    20  0   5   0   0   0   0
    0   0   0   7   20  0   0
    0   0   0   20  19  0   0
    0   0   0   0   0   8   0
    0   0   0   0   0   0   13  

Table2
0
2
10
-5
3
-10
-5

我可以检索它们并获得两张桌子吗?

因此,如果我打印我的数据表1,我会得到第一个表,如果我打印我的数据表2,我会得到第二个表。

我知道如果mytext.txt只有一个表,我可以做类似的事情:

table1 <- read.table("mytext.txt")

2 个答案:

答案 0 :(得分:2)

1)假设输入文件为tables.txt,请将行读入Lines并让names.ix成为包含表名的行的索引 - - 这些行被标识为以不是减号或数字的字符开头。然后创建一个分组变量grp,用于标识每行所属的表,将行拆分为这些组并读取每组行。这不使用任何包,可以处理文件中的任意数量的表。

Lines <- readLines("tables.txt")
names.ix <- grep("^[^-0-9]", Lines)
grp <- Lines[names.ix][ cumsum(seq_along(Lines) %in% names.ix) ]
Read <- function(x) read.table(text = x)
L <- lapply(split(Lines[-names.ix], grp[-names.ix]), Read)

,并提供:

> L
$Table1
  V1 V2 V3 V4 V5 V6 V7
1 13  3 20  0  0  0  0
2  3 10  0  0  0  6  0
3 20  0  5  0  0  0  0
4  0  0  0  7 20  0  0
5  0  0  0 20 19  0  0
6  0  0  0  0  0  8  0
7  0  0  0  0  0  0 13

$Table2
   V1
1   0
2   2
3  10
4  -5
5   3
6 -10
7  -5

2)顺便说一句,如果您只需要第一张表,那就可以了:

library(data.table)
fread("tables.txt")

答案 1 :(得分:1)

不是直接,但您可以在我的“SOfun”软件包available only on GitHub中尝试read.mtable

这种方法类似于@ G.Grothendieck的方法,但打包成一个函数,所以你可以简单地做:

read.mtable("tables.txt", chunkId = "Table", header = FALSE)
# $Table1
#   V1 V2 V3 V4 V5 V6 V7
# 1 13  3 20  0  0  0  0
# 2  3 10  0  0  0  6  0
# 3 20  0  5  0  0  0  0
# 4  0  0  0  7 20  0  0
# 5  0  0  0 20 19  0  0
# 6  0  0  0  0  0  8  0
# 7  0  0  0  0  0  0 13
# 
# $Table2
#    V1
# 1   0
# 2   2
# 3  10
# 4  -5
# 5   3
# 6 -10
# 7  -5

chunkId参数也可以是正则表达式,如`chunkId =“[A-Za-z] +”。