我已经做了一些搜索,但我发现的任何事情都不能很好地满足我的问题......
我在Oracle数据库中有一个表,我希望在R中运行回归,在R中创建分类/回归树等。表本身几乎是1000万行 - 在.tsv文件中为2.12GB - 与28个不同类型的字段(整数,数字,varchar,时间戳等),我已经导出了'它到.tsv文件。
我需要知道如何将这些数据导入R,如果R甚至可以"处理"这个数据的数据。我研究了RODBC包并试图使用odbcConnect,但我不知道' dsn'参数是该命令。这是我的数据库的SID +主机名的组合吗?即使我知道dsn参数并将我的数据库连接到R,我是否可以将表格放入data.frame并对其进行一般分析?
一般和具体的回应都将受到热烈的赞赏!
谢谢, 克拉克
答案 0 :(得分:0)
试试这个:
df <- read.table('file.tsv', header=TRUE, sep="\t")
R应该能够处理大的数据集。您始终可以使用拆分实用程序将其拆分为较小的文件。