Bigmemory包和ff

时间:2015-11-09 22:21:25

标签: r

有关使用不同类别的列处理大数据的任何建议吗? Big.matrix让我失去了非整数类型的列,所以我不能使用它。 我的数据包含大约2亿个案例和30个变量。我必须运行30个循环,每个循环运行超过20个小时。有什么建议可以告诉你吗?我可以试试其他任何套餐吗? 不幸的是,f 3.2不适用于R 3.2.0(或者至少我似乎无法访问它)

我的循环包括根据数值分析为新变量赋值,它们如下所示:

tol <- 0.01
for (i in 1:length(X$latitude) ){ 
if(abs(X$latitude[i] - 40.759161) <  tol && 
abs(X$latitude[i] - 40.758083) <  tol) 
if(abs(X$longitude[i] - -73.985267) < tol &&
abs(X$longitude[i] - -73.986950) < tol)
{
X$Name[i] <- 1
}
}

谢谢,

0 个答案:

没有答案