在R中读取大数据和逻辑回归

时间:2012-07-09 18:28:42

标签: r bigdata regression logistic-regression read.table

情况:1GB CSV文件,100000行,4000个独立数字变量,1个因变量。 R在Windows Citrix服务器上,具有16GB内存。

问题:我花了2个小时!要做:

read.table("full_data.csv", header=T, sep",")

并且glm进程崩溃,程序没有响应,我必须在任务管理器中将其关闭。

1 个答案:

答案 0 :(得分:3)

我经常使用包sqldf在内存中加载大型.csv。一个好的指针是here