我有一个带有不同尺寸的制表符分隔日志文件的目录,我正在尝试将它们加载到R。
Dir:
File1 (col1,col2,col3)
File2 (col3,col4,col5,col6,col7)
File3 (col1,col8,col9,col10)
要做到这一点:我将目录中的所有文件连接到:all_files.tsv
当我尝试按照预期在R中加载它时,它给了我一条错误消息:
扫描错误(文件,内容,nmax,sep,dec,quote,skip,nlines,na.strings,: 第436行没有12个元素
我使用的代码是:
data <- read.table("all_vid_logs.tsv",
header=FALSE,
sep="\t" # use "\t" for tab-delimited files
)
所以,我的问题是: 1.将所有这些文件加载到R中的数据框中的最佳方法是什么?
我期望的输出是一个包含所有列的单个平面结构。
答案 0 :(得分:1)
显然他们有不同的长度(nrows)。然后read.table/read.csv
可能无法读取您的连接文件。
因此,将它们分别读入各个数据帧。然后用NA填充来确定你需要做什么连接操作。
df1 <- read.csv(file1, ...)
df2 <- read.csv(file2, ...)