如何计算Python中LOWESS回归的置信区间?我想将这些作为阴影区域添加到使用以下代码创建的LOESS图中(除了statsmodel之外的其他包也很好)。
import numpy as np
import pylab as plt
import statsmodels.api as sm
x = np.linspace(0,2*np.pi,100)
y = np.sin(x) + np.random.random(100) * 0.2
lowess = sm.nonparametric.lowess(y, x, frac=0.1)
plt.plot(x, y, '+')
plt.plot(lowess[:, 0], lowess[:, 1])
plt.show()
我在webblog Serious Stats中添加了一个带有置信区间的示例图(它是使用R中的ggplot创建的)。
答案 0 :(得分:11)
LOESS没有标准错误的明确概念。在这种情况下,它并不意味着什么。从那以后,你坚持使用蛮力方法。
引导您的数据。您将使用LOESS曲线拟合自举数据。请参阅本页中间部分,以了解您的工作情况。 http://statweb.stanford.edu/~susan/courses/s208/node20.html
获得大量不同的LOESS曲线后,您可以找到顶部和底部的第X个百分位数。
答案 1 :(得分:0)
这是一个非常老的问题,但这是在Google搜索中弹出的第一个问题。您可以使用scikit-misc中的loess()函数执行此操作。这是一个示例(我尝试保留您的原始变量名,但是为了使它更显眼,我稍微增加了噪点)
import numpy as np
import pylab as plt
import statsmodels.api as sm
x = np.linspace(0,2*np.pi,100)
y = np.sin(x) + np.random.random(100) * 0.4
l = loess(x,y)
l.fit()
pred = l.predict(x, stderror=True)
conf = pred_obj.confidence()
lowess = pred_obj.values
ll = conf.lower
ul = conf.upper
plt.plot(x, y, '+')
plt.plot(x, lowess)
plt.fill_between(x,ll,ul,alpha=.33)
plt.show()
结果:
答案 2 :(得分:0)
对于我的一个项目,我需要为时间序列建模创建间隔,并提高程序效率,我创建了tsmoothie:一个用于以矢量化方式进行时间序列平滑和离群值检测的python库
它提供了不同的平滑算法以及计算间隔的可能性。
对于LowessSmoother
:
import numpy as np
import matplotlib.pyplot as plt
from tsmoothie.smoother import *
from tsmoothie.utils_func import sim_randomwalk
# generate 10 randomwalks of length 200
np.random.seed(33)
data = sim_randomwalk(n_series=10, timesteps=200,
process_noise=10, measure_noise=30)
# operate smoothing
smoother = LowessSmoother(smooth_fraction=0.1, iterations=1)
smoother.smooth(data)
# generate intervals
low, up = smoother.get_intervals('prediction_interval', confidence=0.05)
# plot the first smoothed timeseries with intervals
plt.figure(figsize=(11,6))
plt.plot(smoother.smooth_data[0], linewidth=3, color='blue')
plt.plot(smoother.data[0], '.k')
plt.fill_between(range(len(smoother.data[0])), low[0], up[0], alpha=0.3)
我还指出,tsmoothie可以向量化方式对多个时间序列进行平滑处理。希望这可以帮助某人