目前,我一直在手工为我的所有数据进行Prism模型拟合。这是相当繁琐和耗时的。我想知道是否有任何方法可以提高数据分析的效率。我熟悉Python,所以我想从python开始考虑更好的工作流程。非常感谢您的帮助。
两个问题:
如何在python中进行两个状态模型拟合(图1)?在我的情况下,它将具有初始线性增加,然后是水平平台状态。我希望在python中实现的方式以及自动检测发生变化的转折点的方式(理想情况下我可以得到它发生的时间和斜率)
另一种情况是状态变为指数式或多项式。有没有办法在python中自动判断哪个模型最好。
答案 0 :(得分:0)
Scipy提供了支持自定义函数的最小二乘曲线拟合方法。以下是第一个模型的示例:
import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
#custom fit function - first slope steeper than second slope
def two_lin(x, m1, n1, m2, n2):
return np.min([m1 * x + n1, m2 * x + n2], axis = 0)
#x/y data points
x = np.asarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
y = np.asarray([2, 4, 8, 12, 14, 18, 20, 21, 22, 23, 24])
#initial guess for a steep rising and plateau phase
start_values = [3, 0, 0, 3]
#curve fitting
fit_param, pcov = curve_fit(two_lin, x, y, p0 = start_values)
#output of slope/intercept for both parts
m1, n1, m2, n2 = fit_param
print(m1, n1, m2, n2)
#calculating sum of squared residuals as parameter for fit quality
r = y - two_lin(x, *fit_param)
print(np.sum(np.square(r)))
#point, where the parts intersect
if m1 != m2:
x_intersect = (n2 - n1) / (m1 - m2)
print(x_intersect)
else:
print("did not find two linear components")
#plot data and fit function
x_fit = np.linspace(-1, 11, 100)
plt.plot(x, y, 'o', label='data')
plt.plot(x_fit, two_lin(x_fit, *fit_param), '--', label='fit')
plt.axis([-2, 12, 0, 30])
plt.legend()
plt.show()
有关scipy.optimize.curve_fit
can be found in the reference guide.的更多信息对于多项式,numpy提供了numpy.polyfit
和numpy.poly1d
的标准函数,但您仍需提供预期的度数。
残差平方和可用于比较不同拟合函数的精度。