按如下方式加载包:
R version 3.1.1 (2014-07-10)
Platform: x86_64-apple-darwin10.8.0 (64-bit)
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] data.table_1.9.3 dplyr_0.3
loaded via a namespace (and not attached):
[1] assertthat_0.1 DBI_0.3.1 magrittr_1.0.1 parallel_3.1.1 plyr_1.8.1 Rcpp_0.11.2
[7] reshape2_1.4 stringr_0.6.2 tools_3.1.1
尝试尝试有趣的" data_frame"函数在新的dplyr_0.3中。在构建数据框架时,似乎data_frame无法进行回收。这是故意的吗?
data_frame(x=letters[1:10], y=1:5, z=runif(10)) ## pay attention to "y" column
Error in data_frame_(lazyeval::lazy_dots(...)) :
arguments imply differing number of rows: 10, 5, 10
然而,基础data.frame函数可以实现......
data.frame(x=letters[1:10], y=1:5, z =runif(10))
x y z
1 a 1 0.54345855
2 b 2 0.98478537
3 c 3 0.51510861
4 d 4 0.03766893
5 e 5 0.32097472
6 f 1 0.77391366
7 g 2 0.61993720
8 h 3 0.87983035
9 i 4 0.63159025
10 j 5 0.53198094
虽然如果预期数据帧的行数乘以" y"中的元素数量,data.frame将给出错误。 column不是整数:
data.frame(x = letters[1:10], y = 1:4, z = runif(10)) ## Note the change on "y"
Error in data.frame(x = letters[1:10], y = 1:4, z = runif(10)) :
arguments imply differing number of rows: 10, 4
似乎只有data.table可以尝试使用给出的警告消息完成任务:
data.table(x = letters[1:10], y = 1:4, z = runif(10))
x y z
1: a 1 0.17149580
2: b 2 0.56452774
3: c 3 0.01237395
4: d 4 0.47183540
5: e 1 0.52561037
6: f 2 0.27053798
7: g 3 0.82603959
8: h 4 0.73871563
9: i 1 0.03931619
10: j 2 0.34125535
Warning message:
In data.table(x = letters[1:10], y = 1:4, z = runif(10)) :
Item 2 is of size 4 but maximum size is 10 (recycled leaving remainder of 2 items)
为什么这些不同的行为与" data_frame"和" data.frame"? 我正在使用dplyr和data.table包同时处理数据帧和数据表。了解行为有助于避免昂贵的错误。谢谢。
答案 0 :(得分:2)
data_frame
的帮助文本:“只回收长度1输入。”。是的,我认为这是有意的。
问:“为什么?”:可能是因为data_frame
是“data.frame”的“精简版”(来自?data_frame
)。