标签: r bigdata regression logistic-regression read.table
情况:1GB CSV文件,100000行,4000个独立数字变量,1个因变量。 R在Windows Citrix服务器上,具有16GB内存。
问题:我花了2个小时!要做:
read.table("full_data.csv", header=T, sep",")
并且glm进程崩溃,程序没有响应,我必须在任务管理器中将其关闭。
答案 0 :(得分:3)
我经常使用包sqldf在内存中加载大型.csv。一个好的指针是here。
sqldf