假设我有一个数据框,其中有一个列(名为" Type"),有3个级别。然后在每个类型中,有多个子类型。我想将这些数据视为一棵树,只显示字段名称而不显示。与该分类匹配的行数。我没有庞大的数据集(比如1000行),但我希望看到不同级别的频率分布。
------------------------
A B C (Type)
(75) (50) (25)
| | |
A1 A2 A3 B1 B2 B3 .... (SubType).
(10) (15) (50) ...
如果有超过所有子类型的第三个字段(比如优先级),那么有什么可以让它变得有趣。
------------------------
A B C (Type)
(75) (50) (25)
| | |
A1 A2 A3 B1 B2 B3 .... (SubType).
(10) (15) (50) ...
\ / \ / \ /
High medium low (priority)
我不知道如何开始。任何提示都会有所帮助。我做了频率分配。使用像这样的ggplot
ggplot(DATA, aes(Type, fill = SubType)) + geom_bar(stat = 'bin', alpha = 1)
但是下面的任何更多级别都会让人难以想象。所以我认为树结构可能更好。
由于