来自分类或回归算法模型

时间:2017-05-16 19:40:33

标签: machine-learning scikit-learn classification regression

我已经为机器学习创建了样本数据,只是为了检验分类和回归模型的工作原理。

我的示例数据有50行,其中包含MemoryCPUResponsetime的列。我使用公式Responsetime生成了Memory*2 + CPU*0.7

现在,当我使用此数据生成分类模型时,使用不同的算法,如 DecisionTree RandomForest SVM NaiveBayes < / em>, SGD LogisticRegression ,我从模型中获取kappa和相关系数(model.coef_),并在决策树,随机森林的情况下使用特征重要性

MemoryCPU返回的系数值不在我用于生成响应时间值的公式附近。在这种情况下,我无法理解生成的模型是否适合用于预测。

对于回归,线性回归确实给出了与我的公式匹配的正确系数。

1 个答案:

答案 0 :(得分:1)

您给出了一个线性公式:(Memory*2 + CPU*0.7)和线性回归,一种学习B_jy_i = B_0*1 + B_1*X_i_1 + ... + B_n*X_i_n值的方法,能够使用您期望的系数对其进行建模。这是因为线性回归模型的形式与方程的形式相匹配,因此直接匹配系数是有意义的。

对于您的分类算法,不仅方程的形式与您的线性方程不匹配,而且问题也不是真正的分类问题。您举了一个明显是回归问题的例子。