给出:
f = pd.DataFrame({"a": [1,2,3], "b": [1,2,3]})
ax = sns.regplot(x="a", y="b", data=f)
我得到的这张图令人困惑,因为这些点已完美对齐。为什么会有阴影区域?我想我不明白阴影到底意味着什么。
答案 0 :(得分:1)
这是您的回归估计的置信区间,您可以在ci选项sns.regplot
下看到:
ci int in [0,100]或无,可选,置信区间的大小 用于回归估计。这将使用半透明绘制 回归线附近的波段。估计置信区间 使用引导程序;对于大型数据集,建议避免 通过将此参数设置为“无”进行计算。
在您的示例中,数据被引导,并进行了回归拟合,所获得的预测超过1000倍,因此对于每个数据点,您可以拥有95%的CI。 Bootstrap具有替换功能,因此您可以说[1,1,2]和[1,1,2]等,因此您将看到错误。通常,当样本数量较少时,误差可能会更大
您可以通过以下方法将其关闭:
ax = sns.regplot(x="a", y="b", data=f,ci=None)