我正在使用lmfit
将四参数逻辑曲线拟合到我的数据,其当前代码如下:
import matplotlib, numpy as np, matplotlib.pyplot as plt
from lmfit import Model
def pl(x, a, b, c, d):
return (a - d) / (1+ (x / c) ** b) + d
x = [-4.522878745,
-5.22184875,
-5.920818754,
-6.619788758,
-7.318758763,
-8.017728767,
-8.716698771,
-9.415668776,
]
y = [12,
6,
37,
10297,
22635,
24279,
25666,
24365]
mod = Model(pl)
params = mod.make_params(a = 25000, b = 2, c = 1, d = 0)
result = mod.fit(y, params, x=x)
print(result.fit_report())
plt.plot(x, y, 'bo', markersize = 1.5)
plt.plot(x, result.best_fit, color = 'red', linewidth = 0.5)
plt.show()
但是,这会出现以下错误:
Traceback (most recent call last):
File "C:\Users\George\OneDrive\Subjects\EE\Regression.py", line 29, in <module>
result = mod.fit(y, params, x=x)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\model.py", line 1007, in fit
output.fit(data=data, weights=weights)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\model.py", line 1355, in fit
_ret = self.minimize(method=self.method)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 1949, in minimize
return function(**kwargs)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 1492, in leastsq
lsout = scipy_leastsq(self.__residual, variables, **lskws)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\scipy\optimize\minpack.py", line 396, in leastsq
gtol, maxfev, epsfcn, factor, diag)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 538, in __residual
nan_policy=self.nan_policy)
File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 2166, in _nan_policy
raise ValueError("The input contains nan values")
ValueError: The input contains nan values
但是,我注意到的一件事是,如果将参数c
更改为0
,该错误消失,但被以下错误替换:
Warning (from warnings module):
File "C:\Users\George\OneDrive\Subjects\EE\Regression.py", line 5
return (a - d) / (1+ (x / c) ** b) + d
RuntimeWarning: divide by zero encountered in true_divide
此外,“曲线”只是一条直线:
如何解决此问题?
答案 0 :(得分:1)
使用lmfit
或scipy.optimize
(或其他大多数“拟合数据”方法)拟合假定数据,最佳拟合模型和所有参数均为实数。您的模型函数包含(1+ (x / c) ** b)
,其中x
为负,c
是可以在拟合中进行调整的值,而b
和c
均为实数
但是,当然negative_number**fractional_real
(例如(-2.3)**3.4
)是一个复数。拟合算法无法处理这些问题。
因此,您必须决定如何处理复数的可能性。使用(x/c)**int(b)
的建议似乎很有吸引力,但是这意味着拟合将无法找到b
的值-拟合将对每个参数值进行细微调整,并且自{{1} },它将确定对int(2.0) = int(2.000001)
的微小更改不会改变拟合度。也就是说,您可以简单地将拟合值b
固定为0到10之间的整数,然后确定哪个拟合效果最佳。
无论如何,所有假设都假设您的模型函数描述了您的数据,并且实际上是您要使用的数据。我认为您的模型可能无法很好地描述您的数据,因此最好使用实际的物流功能。利用lmfit内置的模型,看起来可能像这样:
b
对于您的数据,这将给出最合适的参数值from lmfit.models import StepModel, ConstantModel
mod = StepModel(form='logistic') + ConstantModel()
params = mod.make_params(amplitude=-20000, center=-7, sigma=1, c=20000)
result = mod.fit(y, params, x=x)
print(result.fit_report())
,sigma ~= 0.24
,center ~= -6.7
和amplitude ~= -25000
,并给出看起来不错的图。
答案 1 :(得分:0)
似乎每次内部调用处理程序函数时,b
的值都会被修改。 b
的值在每次迭代中都会提高其精度,直到值变得如此之大,导致**
操作落入产生nan
s的范围内(内部它是对numpy求值**
)。倒塌时,我的计算机上b
的值为2.0000000298023224
。
您可以确保b
在计算时始终是整数:
def pl(x, a, b, c, d):
return (a - d) / (1+ (x / c) ** int(b)) + d