我可以进一步加快从表中提取数据的速度吗?

时间:2017-11-01 09:11:36

标签: r read.table

我对模拟数据进行了一些分析,并生成了大约100,000个数据集(dataSize)。我想要做的是dat1提取两个数据项(dat2& file1),从{{1}提取一个数据项(dat3) }为每个数据集,然后将它们全部合并为一个数据框file2

每个数据集都有不同的样本量,但100,000个数据集的估计总样本量大约低于10,000,000 tab_out

下面是示例代码作为可重现的示例:

subjectCountTotal

这是一个用于复制过程的包: http://yourdomain.com/product-details/?refer=http://productpage.com/prouct-url

我是R的新手,我刚从地狱的第二圈逃脱(如果我正确地学习了......)。数据提取进度现在不会随着时间的推移而减慢,但估计上述内容仍需要大约5个小时才能完成。

我想知道是否还有方法可以加快速度。

谢谢!

0 个答案:

没有答案