我有一个四阶回归方程,我想找到因变量(y)的值和给出它的相应自变量(x)。本质上,我正在寻找给定范围内曲线斜率为零的点(曲线最低点)。
我的等式是:
y = 2661x^5 + 637x^4 + 9.32x^3 - 3.88x^2 - 0.62x + .21
我感兴趣的是x [-0.155,0.103]范围内的最小值。
实际的方程变量如下:
In [54]:
df3.dtypes
Out[54]:
date datetime64[ns]
expDate datetime64[ns]
X^5 float64
X^4 float64
X^3 float64
X^2 float64
X float64
Const float64
minls float64
maxls float64
dtype: object
In [55]:
df3
Out[55]:
date expDate X^5 X^4 X^3 X^2 \
5 2008-01-02 2008-01-19 2661.368357 637.214501 9.320573 -3.884286
X Const minls maxls
5 -0.621015 0.21083 -0.154444 0.102655
其中minls和maxls是范围变量
有优雅的方法吗?我确实看过scipy.optimize.brent,但却无法按照它的实现。
我还想提一下,我已经在数据框上按[date,expDate]执行了一个组,以防它对解决方案很重要。我的愿望是有一个新变量df3.zerols包含[minls,maxls]范围内的“ls”值
提前感谢您的任何帮助
约翰
更新: 我得到了一些帮助,当我只有一行数据时,能够执行所需的过程。以下是我约会的代码。在执行group-by on date和expDate之后,我需要能够在许多行上执行相同的分析。
In [13]:
%cd C:\Users\camcompco\PycharmProjects\Regression
df=pd.read_csv('min.csv')
C:\Users\camcompco\PycharmProjects\Regression
In [14]:
df.head()
Out[14]:
date expDate X^5 X^4 X^3 X^2 X Const minls \
0 1/2/2008 1/19/2008 2661.37 637.21 9.32 -3.88 -0.62 0.21 -0.15
1 1/2/2008 2/16/2008 188.65 94.25 11.00 -1.44 -0.73 0.22 -0.15
2 1/2/2008 3/22/2008 28.31 19.98 3.85 -0.53 -0.57 0.23 -0.15
3 1/3/2008 1/19/2008 2715.64 571.99 -6.31 -3.66 -0.48 0.20 -0.15
4 1/3/2008 2/16/2008 135.61 76.55 9.96 -1.18 -0.70 0.21 -0.15
maxls
0 0.1000
1 0.1001
2 0.1002
3 0.1003
4 0.1004
In [21]:
row = df.iloc[0]
f = np.poly1d(row.iloc[2:8])
In [22]:
f
Out[22]:
poly1d([2661.3699999999999, 637.21000000000004, 9.3200000000000003,
-3.8799999999999999, -0.62, 0.20999999999999999], dtype=object)
In [23]:
result = scipy.optimize.minimize_scalar(f, bounds=(row["minls"], row["maxls"]), method='bounded')
In [24]:
result.x
Out[24]:
0.066556628458908085
In [25]:
f(result.x)
Out[25]:
0.1702749792881138
In [ ]:
答案 0 :(得分:5)
你说你想要斜率为零的地方,然后你说你想要一个范围内的最小y值。这两者不一定是相同的(在你看的地方甚至不需要局部最小值)。假设您真的对(a)最小y值感兴趣,我们可以使用$ ocaml
OCaml version 4.02.1
# let rec filter f = function
| []->[]
| x::l -> if f=snd x then fst x :: filter f l else [] ;;
val filter : 'a -> ('b * 'a) list -> 'b list = <fun>
# filter 0 [(1,0); (2,1); (3,0)];;
- : int list = [1]
将您的系数转换为函数,然后使用np.poly1d
找到您范围内的最小值。
首先我们制作多项式:
scipy.optimize.minimize_scalar
检查以确保系数符合我们预期的顺序总是一个好主意:
>>> row = df3.iloc[0]
>>> f = np.poly1d(row.iloc[2:8])
>>> f
poly1d([2661.3683569999998, 637.21450100000004, 9.3205729999999996,
-3.8842859999999999, -0.62101499999999998, 0.21082999999999999], dtype=object)
然后我们将>>> f(0)
0.21082999999999999
与有界方法一起使用:
minimize_scalar
我们想要的>>> result = scipy.optimize.minimize_scalar(f, bounds=(row["minls"], row["maxls"]), method='bounded')
>>> result
message: 'Solution found.'
success: True
fun: 0.17101866540403174
status: 0
x: 0.06659055175137768
nfev: 11
值在x
:
result
答案 1 :(得分:0)
scipy.optimize.minimize_scalar
是最佳解决方案 - 它已经过优化,您的示例仅需要进行11次功能评估(result['nfev']
)。我自己去那里但是我太慢了。
我将提供一个自己动手解决方案足够精度,为您提供一个如何思考问题的示例 - 再次假设您正在寻找一个不是零斜率的局部最小值。
import numpy as np
创建poly1d
f = np.poly1d([2661.3683569999998, 637.21450100000004, 9.3205729999999996,
-3.8842859999999999, -0.62101499999999998, 0.21082999999999999])
创建一个具有所需分辨率的自变量数组(本例中为.01)
minx, maxx = (-0.154444, 0.102655)
#resolution = .0001
resolution = .01
x_s = np.linspace(minx, maxx, num = (maxx - minx)/resolution)
>>> x_s
array([-0.154444 , -0.14373154, -0.13301908, -0.12230663, -0.11159417,
-0.10088171, -0.09016925, -0.07945679, -0.06874433, -0.05803188,
-0.04731942, -0.03660696, -0.0258945 , -0.01518204, -0.00446958,
0.00624287, 0.01695533, 0.02766779, 0.03838025, 0.04909271,
0.05980517, 0.07051762, 0.08123008, 0.09194254, 0.102655 ])
>>> np.diff(x_s)
array([ 0.01071246, 0.01071246, 0.01071246, 0.01071246, 0.01071246,
0.01071246, 0.01071246, 0.01071246, 0.01071246, 0.01071246,
0.01071246, 0.01071246, 0.01071246, 0.01071246, 0.01071246,
0.01071246, 0.01071246, 0.01071246, 0.01071246, 0.01071246,
0.01071246, 0.01071246, 0.01071246, 0.01071246])
创建因变量向量
v = f(x_s)
>>> v
array([ 0.30844319, 0.3008677 , 0.29143552, 0.28137826, 0.27156949,
0.26256978, 0.25467177, 0.2479452 , 0.242282 , 0.23744129,
0.2330945 , 0.22887038, 0.22440004, 0.21936206, 0.2135275 ,
0.20680496, 0.19928564, 0.19128841, 0.18340481, 0.17654419,
0.17197868, 0.17138828, 0.17690593, 0.19116253, 0.21733202])
找到v
min_idx = np.where(v == v.min())
>>> min_idx
(array([21]),)
使用该索引检索创建的它的x值。
local_min = x_s[min_idx]
>>> local_min
array([ 0.07051762])
Boolean indexing也可以帮助你
>>> x_s[v == v.min()]
array([ 0.07051762])
>>>