散点图/气泡图的数据可视化

时间:2019-12-17 01:50:55

标签: python data-visualization scatter-plot bubble-chart

目前,我正在使用其中包含超过100个ROOT_CAUSE的数据集之一,并且我想显示它们,使我能够查看最坏的ROOT_CAUSE及其数量(解决问题的最高时间为10%);

在这种情况下,我确实有关于使用散点图和气泡图显示所有内容的想法。我放弃了交叉条形图,因为太多的ROOT_CAUSE使得图无法解释。

我选择散点图和气泡图的原因是这两个图使我能够以颜色访问ROOT_CAUSE,以便可以在相对较小的图中清楚地显示它们。

此外,我还将TAT(用于麻烦的时间)划分为4个级别:低,中,高和0ver 90%,以便我可以轻松观察90%以上的分布。

这是我的一些预处理代码:

## Get basic statistics for discrete features
discrete = for_high.describe(include=['object']).T.reset_index()
discrete.rename(columns={'index':'feature'},inplace=True)
discrete.insert(1,'missing',(rows - discrete['count'])/ float(rows))
discrete

## Get First_blood statistics for continuous features
numeric = for_high.describe(include=['number']).T.reset_index()
numeric.rename(columns={'index':'feature'},inplace=True)
numeric.insert(1,'missing',(rows - numeric['count'])/ float(rows))
numeric

inc_bins = pd.qcut(for_high_clean.TAT, 4)
inc_bins.head(10)

inc_bins = pd.qcut(for_high_clean.TAT, [0, 0.30, 0.60, 0.90, 1], labels = ['low', 'mid', 'high', 'over90'])
inc_bins

enter image description here enter image description here 我想做的是,我想将[TAT]显示为Y,将[#TAT]显示为X,并将[ROOT_CAUSE]映射为颜色。

任何建议都值得赞赏! !

0 个答案:

没有答案