我有一些csv数据集(所谓的DATRAS"交换数据"来自ICES),这些数据集处于一种不寻常的格式,因此有效地将它们导入我的R工作区是一项挑战。
文件的布局如下:
V1 V2 V3 ... V60
................
................
................
V2.1 V2.2 V2.3 ... V2.27
........................
........................
V3.1 V3.2 V3.3 ... V3.27
........................
........................
所以,问题是双重的:在csv文件中有三组(相关的)数据堆叠在一起,我希望能够作为R中的三个独立对象导入;这些数据集具有不同的维度和名称。
到目前为止,我一直在目录中的文件上使用count.fields()
来识别每个数据集之间的边界,readLines()
将整个文件作为每行数据的字符串读取,然后最终根据count.fields()
得出的值对这些字符串进行子集化。
还有更直接的方法吗?我觉得我目前使用的方法非常不优雅。应该注意,这些是大型csv文件。