我已经为机器学习创建了样本数据,只是为了检验分类和回归模型的工作原理。
我的示例数据有50行,其中包含Memory
,CPU
,Responsetime
的列。我使用公式Responsetime
生成了Memory*2 + CPU*0.7
。
现在,当我使用此数据生成分类模型时,使用不同的算法,如 DecisionTree , RandomForest , SVM , NaiveBayes < / em>, SGD , LogisticRegression ,我从模型中获取kappa和相关系数(model.coef_
),并在决策树,随机森林的情况下使用特征重要性
为Memory
和CPU
返回的系数值不在我用于生成响应时间值的公式附近。在这种情况下,我无法理解生成的模型是否适合用于预测。
对于回归,线性回归确实给出了与我的公式匹配的正确系数。
答案 0 :(得分:1)
您给出了一个线性公式:(Memory*2 + CPU*0.7)
和线性回归,一种学习B_j
中y_i = B_0*1 + B_1*X_i_1 + ... + B_n*X_i_n
值的方法,能够使用您期望的系数对其进行建模。这是因为线性回归模型的形式与方程的形式相匹配,因此直接匹配系数是有意义的。
对于您的分类算法,不仅方程的形式与您的线性方程不匹配,而且问题也不是真正的分类问题。您举了一个明显是回归问题的例子。