我不确定描述我的问题的最佳方法。我有一个包含八个变量的数据集,每个变量总共具有 $ 300 $ 值。变量之一是一个因子,其中该变量的大多数值都是数字的(范围从 $ 30 $ 到 $ 90 $ ),但其中很多都被赋值为 $ <20 $ 。这就是为什么该变量是一个因素。
我想做的是对该数据集进行一个子集,并排除发生 $ <20 $ 的所有行。我写了类似的东西:
update_data = subset(data, data$FactorVariable != "<20")
然后我想将此变量转换为数字类型。
data$FactorVariable = as.numeric(data$FactorVariable)
但是,当我在控制台中键入此新数据框时,此变量的值已更改:它们的范围从 $ 30 $ 到 $ 90 $ 了,但范围从 $ 2 $ 到 $ 20 $ 。
我感觉好像我把子集弄错了,但是我不确定如何操纵类型因子的变量!