非常大的.csv文件,

时间:2013-05-13 09:37:09

标签: database r csv

我有大量的数据,大约有2000万行和6列。我试图从这个大的.csv文件中提取数据。 我试过R,但是我收到了错误信息,我使用的是带有4 GB Ram,i5处理器的macbook。 有什么方法可以提取信息, 我试过excel,它只需要100万行。 任何建议或帮助都会有用

文件大于1.3 GB,我想根据参数将此数据库划分为大约2000-3000的集合。我尝试了R,当我使用read.csv时...我试了一会儿但是在10分左右之后我得到R没有回应 -

我想根据第3栏分开这些数据。

SHA PCT实践BNF代码BNF NAME

2 个答案:

答案 0 :(得分:5)

首先,您必须告诉提取数据是什么意思。如果它是某种聚合函数或者它可以被划分,那么我认为最简单的方法是将巨大的csv文件拆分成许多小文件。

如果您还需要其他东西,请在此处查看:

答案 1 :(得分:0)

我会将其转储到SQL数据库(mySQL,postgre,SQLlite,并使用您可以在RODBC包中找到的ODBC驱动程序进行调用(JDBC也可以)。

然后你可以做'SELECT * FROM your_table WHERE column_3 = X;'

祝你好运!

[链接到教程1