Question

我正在编写一个函数来进行非线性曲线拟合并遇到这个错误：

TypeError: Improper input: N=2 must not exceed M=1.

我不知道为什么当我只是从csv文件中读取列时，它认为我正在尝试使用太大的数组。

import math

#stolen sig-fig function <--trust but verify
def round_figures(x, n): 
    return round(x, int(n - math.ceil(math.log10(abs(x))))) 

def try_michaelis_menten_fit( df, pretty=False ):

    # auto-guess
    p0 = ( df['productFinal'].max(), df['substrateConcentration'].mean() )

    popt, pcov = curve_fit( v, df['substrateConcentration'], df['productFinal'], p0=p0 )
    perr = sqrt( diag( pcov ) )

    kcat_km = popt[0] / popt[1]
    # error propegation
    kcat_km_err = (sqrt( (( (perr[0])  / popt[0])**2) + ((  (perr[1])  / popt[1])**2) ))

    kcat = ( popt[0] )
    kcat_std_err = ( perr[0] )

    km_uM = ( popt[1] * 1000000 )
    km_std_err = ( perr[1] *1000000)


    if pretty:



        results = { 

        'kcat': round_figures(kcat, 3),
        'kcat_std_err': round_figures(kcat_std_err, 3),

        'km_uM': round_figures(km_uM, 5),
        'km_std_err': round_figures(km_std_err, 3),

        'kcat/km': round_figures(kcat_km, 2),
        'kcat/km_err': round_figures(kcat_km_err, 2),

        }

        return pandas.Series( results )
    else: 
        return popt, perr 

df = pandas.read_csv( 'PNP_Raw2Fittr.csv' ) 



fits = df.groupby('sample').apply( try_michaelis_menten_fit, pretty=True ) 
fits.to_csv( 'fits_pretty_output.csv' )
print( fits )

我正在读取数据框，这是这样的扩展版本：

   sample   yield    dilution  time  productAbsorbance  substrateConcentration  internalStandard  
0  PNPH_I_4  2.604     10000  2400              269.6                0.007000   2364.0
1  PNPH_I_4  2.604     10000  2400              215.3                0.002333   2515.7
2  PNPH_I_4  2.604     10000  2400              160.3                0.000778   2252.2
3  PNPH_I_4  2.604     10000  2400              104.1                0.000259   2302.4
4  PNPH_I_4  2.604     10000  2400               60.9                0.000086   2323.5
5  PNPH_I_4  2.604     10000  2400               35.4                0.000029   2367.9
6  PNPH_I_4  2.604     10000  2400                0.0                0.000000   2165.3

当我在这个较小版本的数据框架上调用此函数时，它似乎可以正常工作，但是当我在较大版本上使用它时，我会收到此错误。当我添加internalStandard列并在此之前完成工作时，此错误就开始了。更令人困惑的是，当我使用旧版本的数据框恢复旧代码时，它工作正常，但是如果我添加该行，我会得到预期的错误，但是，当我删除相同的行时，我的数据框并再次运行代码我仍然得到相同的错误！

我已经发现我为{@ 1}}而不是method='trf'传递了我的优化方法，而是收到错误lm，但是我确实使用了OverflowError: cannot convert float infinity to integer，有一种特定于无限的类似方法吗？

Answer 1

我认为此错误是指您的x和y（例如df['substrateConcentration']和df['productFinal']）输入数据的长度小于拟合函数curve_fit中定义的给v的拟合参数。这是数学的结果；尝试执行约束太少的曲线拟合（优化）。

我通过提供一个拟合函数来期望scipy.optimize.curve_fit重现相同的错误，该函数期望4个拟合参数具有形状数组（2，）。

例如

import numpy as np
from scipy.optimize import curve_fit

x, y = np.array([0.5, 4.0]), np.array([1.5, 0.6])

def func(x, a, b, c, d):
    return a*x**3. + b*x**2. - c/x + d

popt, pcov = curve_fit(func, x, y)

TypeError：输入不正确：N = 4不能超过M = 2

但是，由于您尚未在问题中提供拟合函数v，因此无法确认这是问题的具体原因。

也许您输入的数据没有按照您认为的那样完全格式化。我建议您检查将数组传递给curve_fit时的外观。您可能错误地解析了数据，从而导致行数最终很小。

我发现我将method ='trf'而不是lm传递给我的优化方法，而是收到错误OverflowError：无法将浮点无穷大转换为整数，但是我确实使用了df.dropna（inplace = True），是否有专门针对无穷大的类似方法？

是的，因此用于优化的不同方法将对输入数据进行不同的检查，并引发不同的错误。这再次表明，您的输入数据存在某种问题。第一种方法可能是拒绝（忽略）那些“ trf”为此错误抛出的行，并且可能最终根本没有行。

TypeError：输入不正确：N = 2不得超过M = 1

1 个答案: