任何人都可以解释我是否拥有从属变量,例如结果(y),由
定义y = K1*F1 + K2*F2 + ... + Kn*Fn + E
每个特征,其中K - 系数,F - 特征(分类和连续),E - 错误
那是否意味着K1*F1
是每1个特征的结果?
答案 0 :(得分:1)
简答:
是的,这意味着什么(如果你不考虑E
)。
长答案: 请参阅下面我刚刚在Jupyter上做的代码。
正如你所看到的,我用一些"噪音生成一些数据"然后将其与sklearn.linear_model.LinearRegression
相符。然后我得到我的系数(+截距),你看到回归实际上是x.coeff +截距,如果我是正确的,那么你是K1*F1
from sklearn.linear_model import LinearRegression
import numpy as np
from matplotlib import pyplot as plt
noise = 2
lr = LinearRegression()
x, y = [], []
i=0
while i<10:
for j in range(np.random.randint(1,5)):
x.append(i)
y.append(i+np.random.rand()*noise+(noise/2))
i+=np.random.rand()
%matplotlib inline
plt.scatter(x, y)
x = np.asarray(x).reshape(-1, 1)
y = np.asarray(y).reshape(-1)
lr.fit(x,y)
plt.plot(x, np.multiply(x, lr.coef_[0])+lr.intercept_)