使用cbind从两个向量创建数据框

时间:2012-10-08 18:40:16

标签: r dataframe

考虑以下R代码。

> x = cbind(c(10, 20), c("[]", "[]"), c("[[1,2]]","[[1,3]]"))
> x
     [,1] [,2] [,3]     
[1,] "10" "[]" "[[1,2]]"
[2,] "20" "[]" "[[1,3]]"

类似地

> x = rbind(c(10, "[]", "[[1,2]]"), c(20, "[]", "[[1,3]]"))
> x
     [,1] [,2] [,3]     
[1,] "10" "[]" "[[1,2]]"
[2,] "20" "[]" "[[1,3]]"

现在,我不希望将整数1020转换为字符串。 如何在没有任何转换的情况下执行此操作?我会的 当然也想知道为什么会发生这种转换。我在看 cbind帮助,也尝试了谷歌搜索,但没有找到一个运气 解。我也相信在某些情况下。 R将字符串转换为 因素,我也不希望这种情况发生,尽管看起来并不像 发生在这里。

2 个答案:

答案 0 :(得分:37)

向量和矩阵只能是单一类型,向量上的cbindrbind会给出矩阵。在这些情况下,数值将被提升为字符值,因为该类型将包含所有值。

(请注意,在rbind示例中,促销活动发生在c来电中:

> c(10, "[]", "[[1,2]]")
[1] "10"      "[]"      "[[1,2]]"

如果您想要一个矩形结构,其中列可以是不同类型,您需要data.frame。以下任何一项都可以满足您的需求:

> x = data.frame(v1=c(10, 20), v2=c("[]", "[]"), v3=c("[[1,2]]","[[1,3]]"))
> x
  v1 v2      v3
1 10 [] [[1,2]]
2 20 [] [[1,3]]
> str(x)
'data.frame':   2 obs. of  3 variables:
 $ v1: num  10 20
 $ v2: Factor w/ 1 level "[]": 1 1
 $ v3: Factor w/ 2 levels "[[1,2]]","[[1,3]]": 1 2

或(特别使用data.frame版本的cbind

> x = cbind.data.frame(c(10, 20), c("[]", "[]"), c("[[1,2]]","[[1,3]]"))
> x
  c(10, 20) c("[]", "[]") c("[[1,2]]", "[[1,3]]")
1        10            []                 [[1,2]]
2        20            []                 [[1,3]]
> str(x)
'data.frame':   2 obs. of  3 variables:
 $ c(10, 20)              : num  10 20
 $ c("[]", "[]")          : Factor w/ 1 level "[]": 1 1
 $ c("[[1,2]]", "[[1,3]]"): Factor w/ 2 levels "[[1,2]]","[[1,3]]": 1 2

或(使用cbind,但是将第一个data.frame作为data.frames进行组合,这样做:

> x = cbind(data.frame(c(10, 20)), c("[]", "[]"), c("[[1,2]]","[[1,3]]"))
> x
  c.10..20. c("[]", "[]") c("[[1,2]]", "[[1,3]]")
1        10            []                 [[1,2]]
2        20            []                 [[1,3]]
> str(x)
'data.frame':   2 obs. of  3 variables:
 $ c.10..20.              : num  10 20
 $ c("[]", "[]")          : Factor w/ 1 level "[]": 1 1
 $ c("[[1,2]]", "[[1,3]]"): Factor w/ 2 levels "[[1,2]]","[[1,3]]": 1 2

答案 1 :(得分:13)

使用data.frame代替cbind应该会有所帮助

x <- data.frame(col1=c(10, 20), col2=c("[]", "[]"), col3=c("[[1,2]]","[[1,3]]"))
x
  col1 col2    col3
1   10   [] [[1,2]]
2   20   [] [[1,3]]

sapply(x, class) # looking into x to see the class of each element
     col1      col2      col3 
"numeric"  "factor"  "factor" 

正如您所见,col1中的元素是numeric

data.frame可以包含不同class的变量:numericfactorcharacter,但matrix不会,将character元素放入矩阵中,无论它们之前是什么样的,所有其他元素都会变成这个类。