Question

所以，我试图使用以下类型的幂律拟合一组数据：

def f(x,N,a): # Power law fit
    if a >0:
        return N*x**(-a)
    else:
        return 10.**300

par,cov = scipy.optimize.curve_fit(f,data,time,array([10**(-7),1.2]))

其他条件只是强迫a为正。使用scipy.optimize.curve_fit产生an awful fit (green line)，分别为N和a返回1.2e + 04和1.9e0-7的值，绝对没有与数据的交集。从我手动放入的拟合中，值分别应该在1e-07和1.2左右分别为N和a，尽管将它们放入curve_fit作为初始参数不会改变结果。去除a的条件会导致更差的拟合，因为它选择了负数，这会导致符合错误的符号斜率。

我无法弄清楚如何获得一个可信的，更不用说可靠的，适合这个例程，但我找不到任何其他好的Python曲线拟合例程。我是否需要编写自己的最小二乘算法，或者我在这里做错了什么？

Answer 1

<强>更新

在原帖中，我展示了一个使用lmfit的解决方案，它允许为参数指定边界。从版本0.17开始，scipy还允许直接为参数分配边界（参见documentation）。请在编辑之后找到此解决方案，这可以作为如何使用scipy curve_fit参数范围的最小示例。

原帖

根据@Warren Weckesser的建议，您可以使用lmfit完成此任务，这样您就可以为参数指定边界并避免这种丑陋的问题。 if-子句。

由于您没有提供任何数据，我创建了一些数据：

他们遵守法律f(x) = 10.5 * x ** (-0.08)

我适合他们 - 正如@ roadrunner66所建议的那样 - 通过线性函数转换幂律：

y = N * x ** a
ln(y) = ln(N * x ** a)
ln(y) = a * ln(x) + ln(N)

所以我首先在原始数据上使用np.log，然后进行拟合。当我现在使用lmfit时，我得到以下输出：

[[Variables]]
    lN:   2.35450302 +/- 0.019531 (0.83%) (init= 1.704748)
    a:   -0.08035342 +/- 0.005158 (6.42%) (init=-0.5)

因此a非常接近原始值，np.exp(2.35450302)得出10.53，这也非常接近原始值。

情节如下：如你所见，拟合非常好地描述了数据：

以下是包含几个内联注释的整个代码：

import numpy as np
import matplotlib.pyplot as plt
from lmfit import minimize, Parameters, Parameter, report_fit

# generate some data with noise
xData = np.linspace(0.01, 100., 50.)
aOrg = 0.08
Norg = 10.5
yData = Norg * xData ** (-aOrg) + np.random.normal(0, 0.5, len(xData))
plt.plot(xData, yData, 'bo')
plt.show()

# transform data so that we can use a linear fit
lx = np.log(xData)
ly = np.log(yData)
plt.plot(lx, ly, 'bo')
plt.show()

def decay(params, x, data):

    lN = params['lN'].value
    a = params['a'].value

    # our linear model
    model = a * x + lN
    return model - data # that's what you want to minimize

# create a set of Parameters
params = Parameters()
params.add('lN', value=np.log(5.5), min=0.01, max=100)  # value is the initial value
params.add('a', value=-0.5, min=-1, max=-0.001)  # min, max define parameter bounds

# do fit, here with leastsq model
result = minimize(decay, params, args=(lx, ly))

# write error report
report_fit(params)

# plot data
xnew = np.linspace(0., 100., 5000.)
# plot the data
plt.plot(xData, yData, 'bo')
plt.plot(xnew, np.exp(result.values['lN']) * xnew ** (result.values['a']), 'r')
plt.show()

修改

假设您安装了scipy 0.17，您还可以使用curve_fit执行以下操作。我将其显示为您对幂律的原始定义（下图中的红线）以及对数数据（下图中的黑线）。以与上面相同的方式生成数据。情节如下：

如您所见，数据描述得非常好。如果您打印popt和popt_log，则分别获得array([ 10.47463426, 0.07914812])和array([ 2.35158653, -0.08045776])（注意：对于您必须使用第一个参数的exponantial的字母 - { {1}}接近原始数据。）

以下是整个代码：

np.exp(popt_log[0]) = 10.502

SciPy曲线拟合失败幂法

1 个答案: