一次可视化高维数据

时间:2019-03-22 23:36:37

标签: python matplotlib visualization seaborn

我正在尝试可视化我的数据,以便可以一一查看所有200列。我想以一种更直观的方式来理解我的数据。

我尝试过google,但在可视化高维数据方面没有任何帮助。人们说要使用PCA,但我想在列中可视化原始数据。

Data set Link

我的代码

x0=df[df["target"]==0]
x1=df[df["target"]==1]

x0_100=x0[1:300]
x1_100=x1[1:300]
x=x1_100.append(x0_100)
y=x["target"]
x=x.drop("target",axis=1)

import matplotlib.pyplot as plt
fig = plt.figure(figsize = (60, 60))
j = 0
for i in x:
    plt.subplot(51,4, j+1)
    j += 1
    sns.boxplot(x=y,y=x[i])

I am getting this type of small figures really difficult to understand

1 个答案:

答案 0 :(得分:1)

我建议绘制两个不同的箱形图,每个箱形图上有一百列:

import numpy as np; np.random.seed(0)
import pandas as pd
import cufflinks as cf

df = cf.datagen.box(200)

df.iloc[:,0:100].plot(kind='box', rot=90, figsize=(14, 8))
plt.tight_layout()

df.iloc[:,100:].plot(kind='box', rot=90, figsize=(14, 8))
plt.tight_layout()

Box plot 1 Box plot 2