我有一个训练数据集,用于确定多元回归中的方程系数。 在此之前,我使用
对数据集进行了规范化scale = StandardScaler()
normalisedData = scale.fit_tranform(data)
然后我使用statsmodels.api中的普通最小二乘来确定系数。
在另一个地方,我将获取新数据作为输入,并且必须找到最终值。存储的系数可用于此。
但在将输入插入等式之前,必须对其进行转换。现在我也可以从训练数据中存储mean_和scale_,但我不确定如何使用这些来对输入中的数据进行标准化。
我知道使用公式
完成了诺曼底化X'=(X-μ)/σ
可以根据此公式直接使用mean_(μ)和scale_(σ)函数的值。
输入数据有10个变量。所以mean_和scale_是大小为10的数组。
感谢。