我正在尝试将分段定义的函数拟合到Python中的数据集。我现在已经搜索了很长一段时间,但我还没有找到答案是否有可能。
要了解我想要做的事情,请查看以下示例(这对我不起作用)。在这里,我试图将移位的绝对值函数(f(x)= | x-p |)拟合到数据集,其中p作为拟合参数。
import scipy.optimize as so
import numpy as np
def fitfunc(x,p):
if x>p:
return x-p
else:
return -(x-p)
fitfunc = np.vectorize(fitfunc) #vectorize so you can use func with array
x=np.arange(1,10)
y=fitfunc(x,6)+0.1*np.random.randn(len(x))
popt, pcov = so.curve_fit(fitfunc, x, y) #fitting routine that gives error
有没有办法在Python中实现这一点?
在R中执行此操作的方法是:
# Fit of a absolute value function f(x)=|x-p|
f.lr <- function(x,p) {
ifelse(x>p, x-p,-(x-p))
}
x <- seq(0,10) #
y <- f.lr(x,6) + rnorm (length(x),0,2)
plot(y ~ x)
fit.lr <- nls(y ~ f.lr(x,p), start = list(p = 0), trace = T, control = list(warnOnly = T,minFactor = 1/2048))
summary(fit.lr)
coefficients(fit.lr)
p.fit <- coefficients(fit.lr)["p"]
x_fine <- seq(0,10,length.out=1000)
lines(x_fine,f.lr(x_fine,p.fit),type='l',col='red')
lines(x,f.lr(x,6),type='l',col='blue')
经过更多的研究,我找到了一种方法。在这个解决方案中,我不喜欢我必须自己定义错误函数的事实。此外,我不确定为什么它必须采用这种lambda风格。因此,非常欢迎任何建议或更复杂的解决方案。
import scipy.optimize as so
import numpy as np
import matplotlib.pyplot as plt
def fitfunc(p,x): return x - p if x > p else p - x
def array_fitfunc(p,x):
y = np.zeros(x.shape)
for i in range(len(y)):
y[i]=fitfunc(x[i],p)
return y
errfunc = lambda p, x, y: array_fitfunc(p, x) - y # Distance to the target function
x=np.arange(1,10)
x_fine=np.arange(1,10,0.1)
y=array_fitfunc(6,x)+1*np.random.randn(len(x)) #data with noise
p1, success = so.leastsq(errfunc, -100, args=(x, y), epsfcn=1.) # -100 is the initial value for p; epsfcn sets the step width
plt.plot(x,y,'o') # fit data
plt.plot(x_fine,array_fitfunc(6,x_fine),'r-') #original function
plt.plot(x_fine,array_fitfunc(p1[0],x_fine),'b-') #fitted version
plt.show()
答案 0 :(得分:3)
要在此完成此操作,我将分享我自己的最终解决方案。为了接近原始问题,您只需自己定义矢量化函数,而不是使用np.vectorize
。
import scipy.optimize as so
import numpy as np
def fitfunc(x,p):
if x>p:
return x-p
else:
return -(x-p)
fitfunc_vec = np.vectorize(fitfunc) #vectorize so you can use func with array
def fitfunc_vec_self(x,p):
y = np.zeros(x.shape)
for i in range(len(y)):
y[i]=fitfunc(x[i],p)
return y
x=np.arange(1,10)
y=fitfunc_vec_self(x,6)+0.1*np.random.randn(len(x))
popt, pcov = so.curve_fit(fitfunc_vec_self, x, y) #fitting routine that gives error
print popt
print pcov
输出:
[ 6.03608994]
[[ 0.00124934]]
答案 1 :(得分:2)
难道你不能简单地用
替换fitfuncdef fitfunc2(x, p):
return np.abs(x-p)
然后产生类似
的东西>>> x = np.arange(1,10)
>>> y = fitfunc2(x,6) + 0.1*np.random.randn(len(x))
>>>
>>> so.curve_fit(fitfunc2, x, y)
(array([ 5.98273313]), array([[ 0.00101859]]))
使用切换功能和/或where
之类的构建块来替换分支,这可以扩展到更复杂的表达式,而无需调用vectorize
。
[PS:最小二乘示例中的errfunc
不需要是lambda。你可以写
def errfunc(p, x, y):
return array_fitfunc(p, x) - y
相反,如果你喜欢。]