这不是一个编码问题,而是关于创建图表的最佳实践的问题。
我在条形图上可视化了以下数据:按行业划分的风险资本投资总额(见截图)。
我所做的是允许在图表中进行重复计算,也就是说,启动资金回合可以属于多个类别。
我听到反馈说这是一个坏主意,在条形图中,不应该重复计算值(因此每个启动只属于一个类别)。
我仍然不相信这是一个坏主意。也许有人可以启发我?
答案 0 :(得分:1)
这实际上不是d3 /编程问题,应该可以迁移到Cross Validated作为数据可视化问题。但我在这里,你就在这里,所以让我们试一试......
如果您确实拥有非独占类别数据,最好使用条形图而不是任何类型的图表(如饼图),这意味着所有值加起来总数。
但你需要明确你所展示的内容,总数是多少以及有多少重复。
通常使用条形图来显示调查结果,其中受访者可以检查多个类别。但结果总是显示为百分比,所以很明显,如果你有70%的人喜欢冰淇淋,60%的人喜欢蛋糕,你知道有重叠(尽管你仍然不喜欢)。我知道多少)。因为你的图表是基于数字而不是百分比,所以甚至没有那么清晰。
您需要的是一个清晰显示所有类别总金额的结构,并且还应该了解每个类别的唯一金额。
一种方法是为"混合"创建一个新类别。或"多个类别"。然后,您的每个其他类别应仅包含该类别中独占的案例,混合值将包括其他案例,并且所有内容仅计算一次。
但是,如果您的大部分案例都是"混合",您可能会以这种方式丢失大量信息。您需要创建一个自定义布局,其中还包含"混合"中的不同类别的细分。
这是静态图像的一种可能结构:堆叠不同的类别(这里并排),但也将它们分隔在另一个维度(这里作为单独的行),以便您可以显示它们的共享"多个类别"总。
_____________________________________________________________________________________
| ECommerce | Payments | Games | Social Media | Food | Multiple categories |
|‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾|
|*************** ************* |
| ~~~~~~~~~~~~~~ ~~~~ |
| ######## ############### |
| oooooooooooooooooooo ooooooooooo |
| xxxxxxxxx |
‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
另一种选择是有一个主图表,显示总数(饼图,或像上面这样的堆积条),没有重叠,然后有一个显示百分比的常规条形图(有重叠,并清楚地表明那里重叠):
Figure 1: Total Capitalization
_____________________________________________________________________________________
| ECommerce | Payments | Games | Social Media | Food | Multiple categories |
‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
1M 700K 200K 1.2M 85K 1.8M
Figure 2: Share of funds per category
(including projects that fall into multiple categories)
ECommerce: **************************** 32%
Payments: ~~~~~~~~~~~~~~~~~~ 25%
Games: ####################### 28%
Social Media: ooooooooooooooooooooooooooooooo 36%
Food: xxxxxxxxx 12%
如果图片仅在线,您还可以进行互动,以便细分"多个类别"群组仅在悬停/点击时显示。