我正在做一个关于算法和数据结构的课程,对于我的作业,我建议在提交之前做很多统计测试。我的测试主要是执行时间,生成输出的随机性等。我正在看R以获取我的数据的图形表示。
我想知道R 喜欢从哪个文件中读取数据,以及哪些文件可以在java中轻松创建。
我看到很多人向R提供csv文件,为此我需要类似java中的openCSV库。另外,与csv-s相比,出于同样目的,以分隔分隔的.txt文件的好坏程度如何?
修改 好吧,当我说喜欢时,我真的没有将R或任何东西个性化......只是我认为这是表达我感受的最佳方式。我在R页面的某处读到excel表格不是一个很好的选择,尤其是来自 post office 2007的那个。那么加上认为能让生活变得如此简单吗?,我找到了我正在寻找的那个软件,她接受了我的简单的分页文本文件并给了我所有我想要的东西?看起来好得令人难以置信。
我感谢大家的回答,R似乎对数据导入文件类型是公正的。
答案 0 :(得分:1)
这里的答案是R并不真正“喜欢”任何东西。它非常适合处理多种数据格式。
read.csv
或read.csv2
,具体取决于您的CSV文件所包含的分隔符。read.delim
或read.delim2
,具体取决于您拥有的小数分隔符。这里的选项卡是默认选项,但原则上可以是任何选项。甚至是a,或;。read.fwf
,它还使用制表符作为默认分隔符。那应该给你一些想法。
答案 1 :(得分:-1)
如果您有非常大的数据集,我建议使用SQL变体。有了它,你可以很容易地选择子集。当然,您必须首先将其转换为数据库格式,通过执行以下操作可以实现:
LOAD DATA LOCAL INFILE 'csvTest.csv'
INTO TABLE csvImport
FIELDS TERMINATED BY ';'
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES
(参见http://code.dedu.ch/2011/07/csv-file-direkt-in-mysql-importieren/,不幸的是德语教程,但那里提供的代码应该足够了。)
编辑:忘记附上SQL包链接: http://cran.r-project.org/web/packages/RMySQL/index.html
在所有其他情况下,R不喜欢任何数据。您只需像其他人建议的那样正确配置阅读过程。