使用Forborn与Seaborn来创建许多分布图

时间:2019-11-25 08:51:19

标签: python for-loop seaborn distribution

我正试图一次创建多个分布图到几个不同的字段。我创建了简单的for循环,但是我总是犯同样的错误,而python无法理解什么是“ i”。

这是我编写的代码:

for i in data.columns:
    sns.distplot(data[i])
  

KeyError:'i'

我也试图用'i'代替i,但是出现错误:

  

TypeError:/的不支持的操作数类型:“ str”和“ int”

我相信我的错误是我对循环不了解的一些基本知识,因此了解这一点对将来会有很大帮助。

我的最终目标是一次获得许多分布图(具有偏度和峰度值),而无需编写每个分布图。

2 个答案:

答案 0 :(得分:2)

要仅在数字列上运行,请使用:

numeric_data = data._get_numeric_data()
for i in numeric_data.columns:
    sns.distplot(numeric_data[i])

答案 1 :(得分:1)

如评论中所述,您不能从字符串列进行分配。如果要忽略字符串列,可以在遍历字符串列时检查每个列,如下所示:

for i in data.columns:
    if(data[i].dtype == np.float64 or data[i].dtype == np.int64):
          sns.distplot(data[i])
    else:
          //your code to handle strings.

我根据您的需要进行了简单的测试,它在我的机器上运行良好。这是代码:

import seaborn as sns
import matplotlib.pyplot as plt
a = [1,2,3,4]
c = [1,4,6,7,4,6,7,4,3,5,543,543,54,46,656,76,43,56]
d = [43,3,3,56,5,76,686,876,8768,78,77,98,79,8798,987,978,98]
sns.distplot(a)
e = [a,c,d]
for i, col in enumerate(e):
    plt.figure(i)
    sns.distplot(col)
plt.show()

在您的情况下,将是这样:

import matplotlib.pyplot as plt
for index, i in enumerate(data.columns):
        if(data[i].dtype == np.float64 or data[i].dtype == np.int64):
              plt.figure(index)
              sns.distplot(data[i])
        else:
              //your code to handle strings.
plt.show()