ggvis layer_histograms中的因素

时间:2015-02-11 17:41:03

标签: r histogram dplyr ggvis

我在ggvis中遇到因子变量问题。我在下面添加了一个示例df,它模拟了我的真实数据。基本上我试图通过按类别填写的客户获得直方图。在dplyr管道的最后,我有" cust"和"总计"按类别划分的事件,我得到的是" cust"因子。我认为这是一个分组问题,因此我的示例包含我尝试过的代码,并为我的问题添加了一些其他颜色。提前谢谢。

示例数据框

df = data.frame(cust=rep(c("cust1","cust2","cust3"),each=3), 
                category=rep(c("q1","q2","q3"), 3, each=4), 
                val=1:4)

如果我注释掉group / ungroup语句,我会得到一个因子范围错误,无法注释x =〜总线图,正确填充单个条形图。错了,但创造了geom。

df %>% group_by(cust, category)  %>%
  summarise(total=sum(n())) %>%
  ungroup() %>%
  select(cust, category, total) %>%
  group_by(category) %>%
  ggvis(x=~cust, fill=~category) %>%
  #ggvis(x=~total, fill=~category) %>%
  layer_histograms(opacity:=1/2, stack=TRUE, width=2)
Error in Summary.factor(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L), na.rm = FALSE) : 'range' not meaningful for factors

这是ggplot2中的等效图,这是我认为我正在寻找的。我遗漏了上面用于调试的所有group / ungroup行。

g <- ggplot(data=df %>% group_by(cust, category)  %>%
              summarise(total=sum(n())), aes(y=total, x=cust, fill=category))
g + geom_histogram(stat="identity")  

以下会话信息。

sessionInfo()
R version 3.1.2 (2014-10-31)
Platform: x86_64-redhat-linux-gnu (64-bit)

locale:
[1] C

attached base packages:
[1] parallel  stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] ggvis_0.4          doMC_1.3.3         iterators_1.0.7    foreach_1.4.2     
 [5] caret_6.0-41       ggplot2_1.0.0      lattice_0.20-29    RColorBrewer_1.1-2
 [9] dplyr_0.4.1        magrittr_1.5       lubridate_1.3.3    stringr_0.6.2     
[13] data.table_1.9.4  


loaded via a namespace (and not attached):
 [1] BradleyTerry2_1.0-5  DBI_0.3.1            MASS_7.3-35         
 [4] Matrix_1.1-4         R6_2.0.1             RJSONIO_1.3-0       
 [7] Rcpp_0.11.3          assertthat_0.1       brglm_0.5-9         
[10] car_2.0-22           chron_2.3-45         codetools_0.2-9     
[13] colorspace_1.2-4     digest_0.6.8         grid_3.1.2          
[16] gtable_0.1.2         gtools_3.4.1         htmltools_0.2.6     
[19] httpuv_1.3.2         jsonlite_0.9.14      lazyeval_0.1.10.9000
[22] lme4_1.1-7           memoise_0.2.1        mime_0.2            
[25] minqa_1.2.4          munsell_0.4.2        nlme_3.1-118        
[28] nloptr_1.0.4         nnet_7.3-8           plyr_1.8.1          
[31] proto_0.3-10         reshape2_1.4.1       scales_0.2.4        
[34] shiny_0.11           splines_3.1.2        tools_3.1.2         
[37] xtable_1.7-4        

1 个答案:

答案 0 :(得分:0)

我今天能够深入挖掘这个问题并对任何遇到同样问题的人进行临时修复。由于RStudio网站上的一些例子也被打破了,我认为有人会碰到这个。

如果您对前一次调用ggvis进行了跟踪,则会在使用自定义范围函数的compute_bin.R中计算分档的位置。由于您无法在某个因素上调用range(),因此它会在那里中断。我已经在GitHub上提交了修复请求,但在调用ggvis时,临时修复是unclass()因素,如下所示。

希望这有帮助。

z %>%
  ggvis(x=~unclass(cust), fill=~category) %>%
  layer_histograms(opacity:=1/2, stack=TRUE, width=0.5)