R:动态组合因素

时间:2017-04-25 07:56:06

标签: r

我想做以下事情:

  1. 打开数据集。
  2. 获取因变量的因子级别
  3. 循环通过因子级别
  4. 为新的因变量因子
  5. 创建新的临时列
  6. 对于每个级别,将所有其他级别名称更改为"其他"并插入新栏目
  7. 运行一些分析(我知道在重新编码因子级别后该怎么做)。
  8. 我不知道如何做上面第5点(我花了一些时间研究)

    indf <- read.csv(".\\datafiles\\jobDescription\\nouns-categorical_R1.csv")     
    
    majorAsFactor <- levels(as.factor(indf$Major0))     
    
    for(i in majorAsFactor)     
    {     
      printToLog(i)     
      Major1 <- vector("character")     
      indf["Major1"] <- Major1     
    
    }
    

1 个答案:

答案 0 :(得分:1)

好吧,我通过将谷歌搜索更改为“重新编码因素”找到答案。有时一切都在寻找合适的关键词。

答案如下:

  indf$Major1[indf$Major0==i] <- as.character(i)
  indf$Major1[indf$Major0!=i] <- "OTHER"