如何在Seaborn线图中使用自定义错误栏?

时间:2019-05-18 22:46:31

标签: matplotlib data-visualization seaborn

我正在使用seaborn.lineplot生成一些时间序列图。我已经在两个列表(例如upper=[1,2,3,4,5] lower=[0,1,2,3,4])中预先计算了一种特定的误差线。有没有一种方法可以自定义错误栏,而不使用lineplot中的CI或Std错误栏?

2 个答案:

答案 0 :(得分:4)

如果您想要 seaborn.lineplot 提供的误差带/条以外的误差带/条,您必须自己绘制它们。以下是如何在 matplotlib 中绘制误差带和误差条并获得与 seaborn 中的图相似的图的几个示例。它们是使用作为 Pandas 数据框导入的 fmri 示例数据集构建的,并且基于 lineplot function 上的 seaborn 文档中显示的示例之一。

import numpy as np                 # v 1.19.2
import pandas as pd                # v 1.1.3
import matplotlib.pyplot as plt    # v 3.3.2
import seaborn as sns              # v 0.11.0

# Import dataset as a pandas dataframe
df = sns.load_dataset('fmri')

# display(df.head(3))
  subject  timepoint event    region    signal
0     s13         18  stim  parietal -0.017552
1      s5         14  stim  parietal -0.080883
2     s12         18  stim  parietal -0.081033

该数据集包含一个名为 timepoint 的时间变量,在 19 个时间点的每个时间点对 信号 进行了 56 次测量。我使用默认的估计量,即平均值。为了简单起见,我没有使用平均值的标准误差的置信区间作为不确定性的度量(又名误差),而是使用每个时间点的测量值的标准偏差。这是通过传递 lineplotci='sd' 中设置的,误差扩展到均值每一侧的一个标准偏差(即对称)。以下是带有误差带的 seaborn 线图(默认情况下):

# Draw seaborn lineplot with error band based on the standard deviation
fig, ax = plt.subplots(figsize=(9,5))
sns.lineplot(data=df, x="timepoint", y="signal", ci='sd')
sns.despine()
plt.show()

sns_lineplot_errband

现在假设我更愿意拥有一个误差带,该误差带跨越平均值每一侧每个时间点测量值的一半标准差。由于在调用 lineplot 函数时无法设置此首选项,因此据我所知,最简单的解决方案是使用 matplotlib 从头开始​​创建绘图。

# Matplotlib plot with custom error band

# Define variables to plot
y_mean = df.groupby('timepoint').mean()['signal']
x = y_mean.index

# Compute upper and lower bounds using chosen uncertainty measure: here
# it is a fraction of the standard deviation of measurements at each
# time point based on the unbiased sample variance
y_std = df.groupby('timepoint').std()['signal']
error = 0.5*y_std
lower = y_mean - error
upper = y_mean + error

# Draw plot with error band and extra formatting to match seaborn style
fig, ax = plt.subplots(figsize=(9,5))
ax.plot(x, y_mean, label='signal mean')
ax.plot(x, lower, color='tab:blue', alpha=0.1)
ax.plot(x, upper, color='tab:blue', alpha=0.1)
ax.fill_between(x, lower, upper, alpha=0.2)
ax.set_xlabel('timepoint')
ax.set_ylabel('signal')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
plt.show()

mpl_lineplot_errband

如果你更喜欢有误差线,这就是seaborn lineplot的样子:

# Draw seaborn lineplot with error bars based on the standard deviation
fig, ax = plt.subplots(figsize=(9,5))
sns.lineplot(data=df, x="timepoint", y="signal", ci='sd', err_style='bars')
sns.despine()
plt.show()

sns_lineplot_errbars

以下是如何使用自定义误差条与 matplotlib 获得相同类型的图:

# Matplotlib plot with custom error bars

# If for some reason you only have lists of the lower and upper bounds
# and not a list of the errors for each point, this seaborn function can
# come in handy:
# error = sns.utils.ci_to_errsize((lower, upper), y_mean)

# Draw plot with error bars and extra formatting to match seaborn style
fig, ax = plt.subplots(figsize=(9,5))
ax.errorbar(x, y_mean, error, color='tab:blue', ecolor='tab:blue')
ax.set_xlabel('timepoint')
ax.set_ylabel('signal')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
plt.show()

# Note: in this example, y_mean and error are stored as pandas series
# so the same plot can be obtained using this pandas plotting function:
# y_mean.plot(yerr=error)

mpl_lineplot_errbars

Matplotlib 文档:fill_betweenspecify error barssubsample error bars

Pandas 文档:error bars

答案 1 :(得分:0)

是的,seaborn只是在后台使用matplotlib,因此您基本上可以做任何您想做的事情,包括使用matplotlib的plt.errorbar添加您自己的自定义错误栏,或者如果您愿意的话甚至创建自己的对象...

话虽如此,您可能可以先尝试调整Seaborn的选项。以我的经验,它提供了非常广泛的自定义面板,并且具有产生非常整洁的视觉效果的优势。

如果您对seaborn不满意,但又不想深入了解matplotlib API,另一种选择是创建具有seaborn的错误栏,然后在方便时对其进行调整(如我所说,它们只是matplotlib对象)

如果您提供一个更具体的示例,我也许可以提供更多帮助