在R中使用什么是良好的可视化来显示2个二进制变量的关联?
我知道phi系数是最好的统计数据,但我怎样才能以图形方式显示?考虑到如果我使用散点图,它会非常简洁,因为只有4个可能的值。
答案 0 :(得分:2)
一个想法是从两个二进制变量的contigency表创建一个mosaicplot
。
让我们假设我们的数据如下:
var1 var2
1 1 1
2 0 0
3 1 1
4 0 0
5 1 1
6 1 1
7 0 0
8 0 1
9 0 1
10 1 0
我们可以通过以下方式将其可视化:
mosaicplot(table(df))
数据强>
df <- structure(list(var1 = c(1, 0, 1, 0, 1, 1, 0, 0, 0, 1), var2 = c(1,
0, 1, 0, 1, 1, 0, 1, 1, 0)), .Names = c("var1", "var2"), row.names = c(NA,
-10L), class = "data.frame")