分类变量的三角图

时间:2019-12-12 15:31:38

标签: r ggplot2 data-visualization ggtern

这是一个问题:为分类变量的三重组合绘制值的最佳方法是什么?

这是我在R中得到的:

library(tidyverse)
library(ggtern)

df_person <- tibble( name = c( 'Alice', 'Bob', 'Carla', 'Dave', 'Eve' ) ) %>%
  rowid_to_column( 'id_person' )

# generate all trios of persons (5 choose 3)  
df <- df_person %>% select( name ) %>%
  map_df( function(x) { combn(x, 3, paste, collapse = '_') } ) %>%
  separate( name, c('person1', 'person2', 'person3') ) %>%
  mutate_all(~ as.factor(.) )
# assign a value to each trio
df$val <- runif( nrow(df) )

# generate ticks and labels for axes
axis <- df_person %>% mutate( fct = as.factor(name) ) %>%
  mutate( tick = as.numeric(fct) / 5 )

ggtern( df, aes(x = as.numeric(person1),
                y = as.numeric(person2),
                z = as.numeric(person3),
                color = val) ) +
  geom_point() +
  scale_T_continuous( breaks = axis$tick, labels = axis$name ) +
  scale_L_continuous( breaks = axis$tick, labels = axis$name ) +
  scale_R_continuous( breaks = axis$tick, labels = axis$name ) +
  labs( x = 'person1', y = 'person2', z = 'person3' )

哪个给出了一个比较奇怪的结果: enter image description here

我希望网格线相交处有十个点(因为它们是分类变量)。

理想情况下,我想生成类似热图的图,即用三角形块代替点。

我们非常感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

好吧,在对ternary plots进行了一些研究之后,我现在知道这不是它们的用法。

在考虑三个变量的贡献总和相同的情况下,这种图很有意义。

对于我的特定用例,最好使用多面条形图:

enter image description here

这仍然不是完美的,因为图中有一些组合从未出现在数据中(例如(Alice,Carla,Carla)),但是确实可以。

如果有人知道该用例的更好的可视化效果,我将非常感兴趣。