使用来自原始代码之外的sklearn的standardscaler的scale_和mean_来规范化测试数据

时间:2017-09-22 11:02:25

标签: python scikit-learn regression normalization

我有一个训练数据集,用于确定多元回归中的方程系数。 在此之前,我使用

对数据集进行了规范化
  

scale = StandardScaler()

     

normalisedData = scale.fit_tranform(data)

然后我使用statsmodels.api中的普通最小二乘来确定系数。

在另一个地方,我将获取新数据作为输入,并且必须找到最终值。存储的系数可用于此。

但在将输入插入等式之前,必须对其进行转换。现在我也可以从训练数据中存储mean_和scale_,但我不确定如何使用这些来对输入中的数据进行标准化。

我知道使用公式

完成了诺曼底化
  

X'=(X-μ)/σ

可以根据此公式直接使用mean_(μ)和scale_(σ)函数的值。

输入数据有10个变量。所以mean_和scale_是大小为10的数组。

感谢。

0 个答案:

没有答案