R应该从哪个文件类型导入数据?

时间:2013-09-05 04:56:59

标签: java r csv

我正在做一个关于算法和数据结构的课程,对于我的作业,我建议在提交之前做很多统计测试。我的测试主要是执行时间,生成输出的随机性等。我正在看R以获取我的数据的图形表示。

我想知道R 喜欢从哪个文件中读取数据,以及哪些文件可以在java中轻松创建。

我看到很多人向R提供csv文件,为此我需要类似java中的openCSV库。另外,与csv-s相比,出于同样目的,以分隔分隔的.txt文件的好坏程度如何?

修改 好吧,当我说喜欢时,我真的没有将R或任何东西个性化......只是我认为这是表达我感受的最佳方式。我在R页面的某处读到excel表格不是一个很好的选择,尤其是来自 post office 2007的那个。那么加上认为能让生活变得如此简单吗?,我找到了我正在寻找的那个软件,她接受了我的简单的分页文本文件并给了我所有我想要的东西?看起来好得令人难以置信。

我感谢大家的回答,R似乎对数据导入文件类型是公正的。

2 个答案:

答案 0 :(得分:1)

这里的答案是R并不真正“喜欢”任何东西。它非常适合处理多种数据格式。

  • CSV文件:read.csvread.csv2,具体取决于您的CSV文件所包含的分隔符。
  • 分隔文件:read.delimread.delim2,具体取决于您拥有的小数分隔符。这里的选项卡是默认选项,但原则上可以是任何选项。甚至是a,或;。
  • 固定宽度格式文件:read.fwf,它还使用制表符作为默认分隔符。

那应该给你一些想法。

答案 1 :(得分:-1)

如果您有非常大的数据集,我建议使用SQL变体。有了它,你可以很容易地选择子集。当然,您必须首先将其转换为数据库格式,通过执行以下操作可以实现:

LOAD DATA LOCAL INFILE 'csvTest.csv'
INTO TABLE csvImport
FIELDS TERMINATED BY ';'
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES

(参见http://code.dedu.ch/2011/07/csv-file-direkt-in-mysql-importieren/,不幸的是德语教程,但那里提供的代码应该足够了。)

编辑:忘记附上SQL包链接: http://cran.r-project.org/web/packages/RMySQL/index.html

在所有其他情况下,R不喜欢任何数据。您只需像其他人建议的那样正确配置阅读过程。