使用lmfit时出现“ ValueError:输入包含nan值”

时间:2019-06-15 08:16:13

标签: python compiler-errors lmfit

我正在使用lmfit将四参数逻辑曲线拟合到我的数据,其当前代码如下:

import matplotlib, numpy as np, matplotlib.pyplot as plt
from lmfit import Model

def pl(x, a, b, c, d):
    return (a - d) / (1+ (x / c) ** b) + d

x = [-4.522878745,
    -5.22184875,
    -5.920818754,
    -6.619788758,
    -7.318758763,
    -8.017728767,
    -8.716698771,
    -9.415668776,
    ]

y = [12,
    6,
    37,
    10297,
    22635,
    24279,
    25666,
    24365]


mod = Model(pl)
params = mod.make_params(a = 25000, b = 2, c = 1, d = 0)
result = mod.fit(y, params, x=x)
print(result.fit_report())


plt.plot(x, y, 'bo', markersize = 1.5)
plt.plot(x, result.best_fit, color = 'red', linewidth = 0.5)
plt.show()

但是,这会出现以下错误:

Traceback (most recent call last):
  File "C:\Users\George\OneDrive\Subjects\EE\Regression.py", line 29, in <module>
    result = mod.fit(y, params, x=x)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\model.py", line 1007, in fit
    output.fit(data=data, weights=weights)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\model.py", line 1355, in fit
    _ret = self.minimize(method=self.method)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 1949, in minimize
    return function(**kwargs)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 1492, in leastsq
    lsout = scipy_leastsq(self.__residual, variables, **lskws)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\scipy\optimize\minpack.py", line 396, in leastsq
    gtol, maxfev, epsfcn, factor, diag)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 538, in __residual
    nan_policy=self.nan_policy)
  File "C:\Users\George\AppData\Local\Programs\Python\Python37\lib\site-packages\lmfit\minimizer.py", line 2166, in _nan_policy
    raise ValueError("The input contains nan values")
ValueError: The input contains nan values

但是,我注意到的一件事是,如果将参数c更改为0,该错误消失,但被以下错误替换:

Warning (from warnings module):
  File "C:\Users\George\OneDrive\Subjects\EE\Regression.py", line 5
    return (a - d) / (1+ (x / c) ** b) + d
RuntimeWarning: divide by zero encountered in true_divide

此外,“曲线”只是一条直线:

enter image description here

如何解决此问题?

2 个答案:

答案 0 :(得分:1)

使用lmfitscipy.optimize(或其他大多数“拟合数据”方法)拟合假定数据,最佳拟合模型和所有参数均为实数。您的模型函数包含(1+ (x / c) ** b),其中x为负,c是可以在拟合中进行调整的值,而bc均为实数

但是,当然negative_number**fractional_real(例如(-2.3)**3.4)是一个复数。拟合算法无法处理这些问题。

因此,您必须决定如何处理复数的可能性。使用(x/c)**int(b)的建议似乎很有吸引力,但是这意味着拟合将无法找到b的值-拟合将对每个参数值进行细微调整,并且自{{1} },它将确定对int(2.0) = int(2.000001)的微小更改不会改变拟合度。也就是说,您可以简单地将拟合值b固定为0到10之间的整数,然后确定哪个拟合效果最佳。

无论如何,所有假设都假设您的模型函数描述了您的数据,并且实际上是您要使用的数据。我认为您的模型可能无法很好地描述您的数据,因此最好使用实际的物流功能。利用lmfit内置的模型,看起来可能像这样:

b

对于您的数据,这将给出最合适的参数值from lmfit.models import StepModel, ConstantModel mod = StepModel(form='logistic') + ConstantModel() params = mod.make_params(amplitude=-20000, center=-7, sigma=1, c=20000) result = mod.fit(y, params, x=x) print(result.fit_report()) sigma ~= 0.24center ~= -6.7amplitude ~= -25000,并给出看起来不错的图。

答案 1 :(得分:0)

似乎每次内部调用处理程序函数时,b的值都会被修改。 b的值在每次迭代中都会提高其精度,直到值变得如此之大,导致**操作落入产生nan s的范围内(内部它是对numpy求值** )。倒塌时,我的计算机上b的值为2.0000000298023224

您可以确保b在计算时始终是整数:

def pl(x, a, b, c, d):
    return (a - d) / (1+ (x / c) ** int(b)) + d