我有一个这样的数据框:
> str(dynamics)
'data.frame': 3517 obs. of 3 variables:
$ id : int 1 2 3 4 5 6 7 8 9 10 ...
$ y2015: int 245 129 301 162 123 125 115 47 46 135 ...
$ y2016: int NA 385 420 205 215 295 130 NA NA 380 ...
我取出3个向量并以不同的名字命名,
第1栏:
> plantid <- dynamics$id
> head(plantid)
[1] 1 2 3 4 5 6
第2栏:
(我把它分成不同的类别并标记为2,3,4和5)
> y15 <- dynamics$y2015
> year15 <- cut(y15, breaks = c(-Inf, 50, 100, 150, Inf), labels = c("2", "3", "4", "5"))
> str(year15)
Factor w/ 4 levels "2","3","4","5": 4 3 4 4 3 3 3 1 1 3 ...
> head(year15)
[1] 5 4 5 5 4 4
Levels: 2 3 4 5
第3栏:
(同样在这里)
> y16 <- dynamics$y2016
> year16 <- cut(y16, breaks = c(-Inf, 50, 100, 150, Inf), labels = c("2", "3", "4", "5"))
> str(year16)
Factor w/ 4 levels "2","3","4","5": NA 4 4 4 4 4 3 NA NA 4 ...
> head(year16)
[1] <NA> 5 5 5 5 5
Levels: 2 3 4 5
到目前为止一切顺利!
当我将上述3个向量按cbind()
组合以形成新数据框时,问题就出现了,新创建的向量级别消失了
看看我的代码:
SD1 = data.frame(cbind(plantid, year15, year16))
head(SD1)
我得到一个这样的数据框:
> head(SD1)
plantid year15 year16
1 1 4 NA
2 2 3 4
3 3 4 4
4 4 4 4
5 5 3 4
6 6 3 4
您可以看到第2列和第3列的级别已从2, 3, 4, 5
更改回1, 2, 3, 4
我该如何解决这个问题?
答案 0 :(得分:2)
cbind
最常用于将对象组合到矩阵中。它从输入中删除特殊属性,以帮助确保它们兼容组合到单个对象中。这意味着具有特殊属性的数据类型(例如因子和日期的名称和格式属性)将简化为其基础数字表示。这就是cbind
将您的因素转化为数字的原因。
相反,data.frame()
本身将保留单个对象属性。在这种情况下,您不必使用cbind
。要保留您的因子水平,只需使用:
SD1 <- data.frame(plantid, year15, year16)