python多个情节为numpy数组

时间:2018-04-01 12:55:19

标签: python numpy matplotlib

我有一个多维的numpy形状阵列(200,1500)。 我想要可视化此数据的摘要统计信息。因为num_cols太高,我无法绘制所有这些。我的问题是:

  1. 我应该想象哪些摘要统计信息?
  2. 我是否可视化所有列?
  3. 我想过随机选择N列 数据并显示分布和箱形图。下面显示的示例是针对数组X中的第二列。但是,我无法弄清楚如何在单个图中显示N列的两个图。有人可以帮我弄这个吗?

    dist plot

    plt.figure(figsize =(20,4)) plt.subplot(121)
    ax = sns.distplot(X [:,1])

    Box Plot

    plt.subplot(122) plt.xlim(X [:,1] .min()* 1.1,X [:,1] .max()* 1.1) sns.boxplot(X = X [:,1])

  4. enter image description here

1 个答案:

答案 0 :(得分:1)

@Shiva所述,摘要统计和可视化方法取决于您的问题。问题表述确定您是否需要均值或中值,标准差,特征值,频率分布等。如果您提供更多详细信息,社区可以提供更具体的建议。

然而,您可以考虑使用通用分析技术。参见例如this blog post演示了应用于MNIST数据集的各种降维技术。另请查看this blog post讨论自动编码器的应用(向下滚动)。更具体的可视化,您可以浏览Seaborn examples gallery以查看是否有任何可以应用于您自己的数据集的示例。