新创建的数据框丢失了其矢量类别的标签

时间:2018-05-09 17:41:02

标签: r dataframe cbind

我有一个这样的数据框:

> str(dynamics)
'data.frame':   3517 obs. of  3 variables:
 $ id   : int  1 2 3 4 5 6 7 8 9 10 ...
 $ y2015: int  245 129 301 162 123 125 115 47 46 135 ...
 $ y2016: int  NA 385 420 205 215 295 130 NA NA 380 ...

我取出3个向量并以不同的名字命名,
第1栏:

> plantid <- dynamics$id
> head(plantid)
[1] 1 2 3 4 5 6

第2栏:
(我把它分成不同的类别并标记为2,3,4和5)

> y15 <- dynamics$y2015
> year15 <- cut(y15, breaks = c(-Inf, 50, 100, 150, Inf), labels = c("2", "3", "4", "5"))
> str(year15)
 Factor w/ 4 levels "2","3","4","5": 4 3 4 4 3 3 3 1 1 3 ...
> head(year15)
[1] 5 4 5 5 4 4
Levels: 2 3 4 5

第3栏:
(同样在这里)

> y16 <- dynamics$y2016
> year16 <- cut(y16, breaks = c(-Inf, 50, 100, 150, Inf), labels = c("2", "3", "4", "5"))
> str(year16)
 Factor w/ 4 levels "2","3","4","5": NA 4 4 4 4 4 3 NA NA 4 ...
> head(year16)
[1] <NA> 5    5    5    5    5   
Levels: 2 3 4 5

到目前为止一切顺利!

当我将上述3个向量按cbind()组合以形成新数据框时,问题就出现了,新创建的向量级别消失了

看看我的代码:

SD1 = data.frame(cbind(plantid, year15, year16))
head(SD1)

我得到一个这样的数据框:

> head(SD1)
  plantid year15 year16
1       1      4     NA
2       2      3      4
3       3      4      4
4       4      4      4
5       5      3      4
6       6      3      4

您可以看到第2列和第3列的级别已从2, 3, 4, 5更改回1, 2, 3, 4
我该如何解决这个问题?

1 个答案:

答案 0 :(得分:2)

cbind最常用于将对象组合到矩阵中。它从输入中删除特殊属性,以帮助确保它们兼容组合到单个对象中。这意味着具有特殊属性的数据类型(例如因子和日期的名称和格式属性)将简化为其基础数字表示。这就是cbind将您的因素转化为数字的原因。

相反,data.frame()本身将保留单个对象属性。在这种情况下,您不必使用cbind。要保留您的因子水平,只需使用:

SD1 <- data.frame(plantid, year15, year16)