我正试图一次创建多个分布图到几个不同的字段。我创建了简单的for循环,但是我总是犯同样的错误,而python无法理解什么是“ i”。
这是我编写的代码:
for i in data.columns:
sns.distplot(data[i])
KeyError:'i'
我也试图用'i'代替i,但是出现错误:
TypeError:/的不支持的操作数类型:“ str”和“ int”
我相信我的错误是我对循环不了解的一些基本知识,因此了解这一点对将来会有很大帮助。
我的最终目标是一次获得许多分布图(具有偏度和峰度值),而无需编写每个分布图。
答案 0 :(得分:2)
要仅在数字列上运行,请使用:
numeric_data = data._get_numeric_data()
for i in numeric_data.columns:
sns.distplot(numeric_data[i])
答案 1 :(得分:1)
如评论中所述,您不能从字符串列进行分配。如果要忽略字符串列,可以在遍历字符串列时检查每个列,如下所示:
for i in data.columns:
if(data[i].dtype == np.float64 or data[i].dtype == np.int64):
sns.distplot(data[i])
else:
//your code to handle strings.
我根据您的需要进行了简单的测试,它在我的机器上运行良好。这是代码:
import seaborn as sns
import matplotlib.pyplot as plt
a = [1,2,3,4]
c = [1,4,6,7,4,6,7,4,3,5,543,543,54,46,656,76,43,56]
d = [43,3,3,56,5,76,686,876,8768,78,77,98,79,8798,987,978,98]
sns.distplot(a)
e = [a,c,d]
for i, col in enumerate(e):
plt.figure(i)
sns.distplot(col)
plt.show()
在您的情况下,将是这样:
import matplotlib.pyplot as plt
for index, i in enumerate(data.columns):
if(data[i].dtype == np.float64 or data[i].dtype == np.int64):
plt.figure(index)
sns.distplot(data[i])
else:
//your code to handle strings.
plt.show()