使用避难所导入R,使用Stata 12或sab7bdat源文件?

时间:2015-11-12 13:05:15

标签: r dataformat r-haven

University of Cape Town通过DataFirst Portal提供数据。

所有数据均以下列格式提供:

  1. SAS(sab7bdat)
  2. SPSS
  3. Stata(12)
  4. 我想使用R将数据集导入Haven packageReadStat Library支持所有上述格式(它使用mt_rand())。

    这样做的首选格式是什么?

    更具体地说:

    1. 原始格式的数据存在差异吗?
    2. 某些格式是否比其他格式更接近R格式,这会影响输出吗?
    3. 速度方面有差异吗? (不太重要)

1 个答案:

答案 0 :(得分:0)

在不同系统之间传输数据的最佳方式是.csv,因为所有系统都可以轻松阅读。

由于您只能访问其他格式,因此不应该有太多差异(假设haven适用于所有格式)。

关于你的问题:

我不知道数据可用性或格式兼容性方面的任何差异。但是,如果你想加快速度,你应该调查data.table及其fread(替换read.table,因此不支持上述文件。)

你可以这样读取数据:

library(haven)
dat <- read_sas("link_to_sas_file")
dat <- read_spss("link_to_spss_file")
dat <- read_stata("link_to_stata_file")