我的问题可以通过这篇文章底部的情节来总结。
它们显示了错误对子网格的渐进放大,关键图位于左列。从本质上讲,我的对子网格中的点非常分散,但是从第3个图中可以看出,它们中的大部分仍然相当本地化,我所期望的是高斯分布。
不幸的是,KDE轮廓图似乎完全错过了大部分点,并在几个异常值周围排序。
这是我正在使用的代码从pandas DataFrame生成图:
import seaborn as sns
from matplotlib import pyplot as plt
g = sns.PairGrid(HP, diag_sharey=False)
g.map_lower(sns.kdeplot, n_levels=5)
g.map_lower(plt.scatter, marker='^', alpha=0.7, color='y')
g.map_upper(plt.scatter, marker='+')
g.map_diag(sns.kdeplot)
我想弄清楚为什么会这样。 kdeplot是否只选择点的子样本或什么?