R /数据清理/用户友好的参考表构造

时间:2016-01-29 16:03:27

标签: r lookup data-cleaning

我们说我有一个因子变量x.fine,它对于分析来说太精细了(太多级别),我想通过创建一个转换{{1}的参考表来减少级别数}到一个新变量x.fine(我尚未开发)。

我可以打开Excel或OpenRefine并以交互方式开始创建查找值,将表导出为CSV并导入R中的连接。因为我只需创建一次表,它将包含在分析中,重现性保证。

但有没有一种简单的方法可以在不离开R / RStudio的情况下创建这样的参考表?

编辑:更改了标题(替换了"互动"与"用户友好")

2 个答案:

答案 0 :(得分:2)

也许library(hash)

library(hash)
x.fine <- c("a", "b", "c", "d", "e")
h <- hash(a = "X", b = "X", c = "Y", d = "Y", e = "Z")
x.coarse <- values(h[x.fine])

答案 1 :(得分:2)

函数questionr::irec打开一个闪亮的应用程序,其中包含可变的原始值和字段以输入新值。它会在退出时将完整代码复制到控制台。

questionr::irec(mydf,"x.fine")