有关使用不同类别的列处理大数据的任何建议吗? Big.matrix让我失去了非整数类型的列,所以我不能使用它。 我的数据包含大约2亿个案例和30个变量。我必须运行30个循环,每个循环运行超过20个小时。有什么建议可以告诉你吗?我可以试试其他任何套餐吗? 不幸的是,f 3.2不适用于R 3.2.0(或者至少我似乎无法访问它)
我的循环包括根据数值分析为新变量赋值,它们如下所示:
tol <- 0.01
for (i in 1:length(X$latitude) ){
if(abs(X$latitude[i] - 40.759161) < tol &&
abs(X$latitude[i] - 40.758083) < tol)
if(abs(X$longitude[i] - -73.985267) < tol &&
abs(X$longitude[i] - -73.986950) < tol)
{
X$Name[i] <- 1
}
}
谢谢,