R程序的首选数据源是什么?

时间:2010-09-26 15:46:15

标签: r input

this link中列出的哪种数据集格式最容易在R中加载?使用文本编辑器几分钟应该足以将文本版本转换为文字数据,但是其他表单中的一个可以用少于O(n)的用户工作量加载吗?

我发现了这个laundry list of IO options,但似乎没什么特别有帮助。


P.S。我之前从未使用过R,而trying to help a friend是需要这样做的人。

3 个答案:

答案 0 :(得分:4)

如果其他一切都失败了,为什么不阅读the manual devoted to Data Import / Export

您可以从

导入数据
  • ascii文件,带有任何分隔符(csv,txt,...)
  • 修复表单文件
  • 各种格式的二进制文件(hdf5,netcdf,...)
  • 电子表格,大多数格式甚至在非Windows平台上
  • 数据库(DBIRODBC,...)
  • 网页(使用XML包)
  • 网络服务,例如SOAPJSON,...
  • 直接来自其他使用连接的程序,......
  • 以及其他

所以调用这些首选中的任何一个都是困难的 - 这一切都取决于手头的任务。

答案 1 :(得分:4)

抓取文本文件,然后按照spreadsheet-like data section R Data Import/Export中的说明操作。除非绝对必要,否则我会避免尝试从Excel文件中读取。

这可能很简单:

x <- read.table("file.txt", header=TRUE, sep="\t")
# or
x <- read.delim("file.txt") # header=TRUE and sep="\t" are already defaults

答案 2 :(得分:1)

从您可用的选项中,制表符分隔的文本文件最容易导入。接下来是SPSS文件,然后是其他所有内容。我同意其他海报,避免使用.xls文件(或将单页工作簿转换为tsv,csv。

外包可以用来打开那些简单的SPSS文件:

install.packages("foreign")
library(foreign)

setwd("/Path/to/your/files")
read.spss("FILENAME.sav", to.data.frame=T)