读取和连接具有不同(nrow,ncol)维度的CSV文件

时间:2015-04-08 00:06:19

标签: r dimensions read.csv ragged

我有一个带有不同尺寸的制表符分隔日志文件的目录,我正在尝试将它们加载到R。

Dir:
File1 (col1,col2,col3)
File2 (col3,col4,col5,col6,col7)
File3 (col1,col8,col9,col10)

要做到这一点:我将目录中的所有文件连接到:all_files.tsv

当我尝试按照预期在R中加载它时,它给了我一条错误消息:

扫描错误(文件,内容,nmax,sep,dec,quote,skip,nlines,na.strings,:   第436行没有12个元素

我使用的代码是:

 data <- read.table("all_vid_logs.tsv",
                   header=FALSE,
                   sep="\t"         # use "\t" for tab-delimited files
    )

所以,我的问题是: 1.将所有这些文件加载​​到R中的数据框中的最佳方法是什么?

我期望的输出是一个包含所有列的单个平面结构。

1 个答案:

答案 0 :(得分:1)

显然他们有不同的长度(nrows)。然后read.table/read.csv可能无法读取您的连接文件。

因此,将它们分别读入各个数据帧。然后用NA填充来确定你需要做什么连接操作。

df1 <- read.csv(file1, ...)
df2 <- read.csv(file2, ...)