dplyr“data_frame”函数无法进行回收和data.frame有限制吗?

时间:2014-09-28 05:40:48

标签: r dataframe dplyr

按如下方式加载包:

R version 3.1.1 (2014-07-10)
Platform: x86_64-apple-darwin10.8.0 (64-bit)

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] data.table_1.9.3 dplyr_0.3       

loaded via a namespace (and not attached):
[1] assertthat_0.1 DBI_0.3.1      magrittr_1.0.1 parallel_3.1.1 plyr_1.8.1     Rcpp_0.11.2   
[7] reshape2_1.4   stringr_0.6.2  tools_3.1.1 

尝试尝试有趣的" data_frame"函数在新的dplyr_0.3中。在构建数据框架时,似乎data_frame无法进行回收。这是故意的吗?

data_frame(x=letters[1:10], y=1:5, z=runif(10))  ## pay attention to "y" column
Error in data_frame_(lazyeval::lazy_dots(...)) : 
  arguments imply differing number of rows: 10, 5, 10

然而,基础data.frame函数可以实现......

data.frame(x=letters[1:10], y=1:5, z =runif(10))
   x y          z
1  a 1 0.54345855
2  b 2 0.98478537
3  c 3 0.51510861
4  d 4 0.03766893
5  e 5 0.32097472
6  f 1 0.77391366
7  g 2 0.61993720
8  h 3 0.87983035
9  i 4 0.63159025
10 j 5 0.53198094

虽然如果预期数据帧的行数乘以" y"中的元素数量,data.frame将给出错误。 column不是整数:

data.frame(x = letters[1:10], y = 1:4, z = runif(10))  ## Note the change on "y"
Error in data.frame(x = letters[1:10], y = 1:4, z = runif(10)) : 
  arguments imply differing number of rows: 10, 4

似乎只有data.table可以尝试使用给出的警告消息完成任务:

data.table(x = letters[1:10], y = 1:4, z = runif(10))
    x y          z
 1: a 1 0.17149580
 2: b 2 0.56452774
 3: c 3 0.01237395
 4: d 4 0.47183540
 5: e 1 0.52561037
 6: f 2 0.27053798
 7: g 3 0.82603959
 8: h 4 0.73871563
 9: i 1 0.03931619
10: j 2 0.34125535
Warning message:
In data.table(x = letters[1:10], y = 1:4, z = runif(10)) :
  Item 2 is of size 4 but maximum size is 10 (recycled leaving remainder of 2 items)

为什么这些不同的行为与" data_frame"和" data.frame"? 我正在使用dplyr和data.table包同时处理数据帧和数据表。了解行为有助于避免昂贵的错误。谢谢。

1 个答案:

答案 0 :(得分:2)

问:“这是故意的吗?”好吧,从data_frame的帮助文本:“只回收长度1输入。”。是的,我认为这是有意的。

问:“为什么?”:可能是因为data_frame是“data.frame”的“精简版”(来自?data_frame)。