生成随机正常数据,然后进行分类

时间:2014-10-19 21:42:47

标签: r normal-distribution r-factor

这是问题/提示

  1. 为此,生成1000个值的向量,这些值是从正态分布中随机抽取的,平均值为50,标准差为10.标记此附加列“RGENDER”。
  2. 更改RGender,使小于50的值标记为男性,50或更大的值标记为女性。使用level()获取$ RGENDER值时,您应该看到“女性”和“男性”。**
  3. 对于1.我有:

    stats$RGENDER <- rnorm(1000, 50 ,10) 
    

    对于2.我在尝试:

    stats1$RGENDER <- factor(stats$RGENDER, levels=c(<50, >50), 
                                                    labels=c("Male", "Female"))
    

    我不断收到错误消息,

    Error: unexpected '<' in "stats$RGENDER <- factor(stats$RGENDER, levels=c(<"

    我不知道该怎么做。有谁知道这是完全错误的功能还是我只是在编写函数时出错?

1 个答案:

答案 0 :(得分:2)

stats <- data.frame(RGENDER=rep(NA,1000))  # Cannot use `$<-` unless df exists
stats$RGENDER <- rnorm(1000, 50 ,10) 
stats$RGENDER <- factor(stats$RGENDER >50, levels=c('TRUE','FALSE'), 
                                                 labels=c("Male", "Female"))

需要设置&#39;级别&#39;所以他们匹配从逻辑运算符返回的内容。

>  table(stats$RGENDER)

  Male Female 
   513    487