R和压缩文件

时间:2017-07-06 20:26:03

标签: r file-io io gzip tar

我有大约1000个tar.gz文件(约2 GB /文件压缩),每个文件包含一堆大的.tsv(制表符分隔)文件,例如1.tsv,2.tsv,3.tsv,4.tsv等。

我想在R中使用.tsv文件的子集(比如1.tsv,2.tsv)而不提取.tar.gz文件,以节省空间/时间。

我试着环顾四周,但无法通过内存找到一个库或例程来流式传输 tar.gz文件,并在运行中从中提取数据。在其他语言中,有效的方法可以做到这一点。如果一个人不能在R

中这样做,我会感到惊讶

有谁知道在R中实现这一目标的方法?任何帮助是极大的赞赏! 注意:解压缩/解压缩文件不是一个选项。我想提取相关字段并将它们保存在data.frame中而不提取文件

0 个答案:

没有答案