对于家庭作业,我需要将几种分类模型拟合到数据集中,并比较它们的升力图以确定最有效的模型。模型产生二进制结果(或二进制结果的概率),我们称之为YES或NO。具有连续输出的模型很容易生成升力图表,因为它可以按置信度的降序轻松订购数据集。
我在使用生成二进制结果的模型(例如k-NN和ClassificationTree)时遇到了麻烦。在我的脑海中,我知道创建置信度值的方法,但我不知道如何使用这些库。
对于k-NN,我将概率置信度设置为落在树中特定路径的训练数据中为“是”的概率。但是使用这种方法和MATLAB中的树模型,我不知道每条记录都通过哪条树路径。
与k-NN类似,我会根据k个邻居得出概率,并从那些k个邻居中找出YES的概率,但模型没有告诉我k个邻居,我宁愿不做搜索它们。
非常感谢任何有关这些问题中的一个或两个的帮助(或者更好的方法在MATLAB中生成升力图表)
答案 0 :(得分:1)
我实际上能够找到自己问题的答案。 MATLAB中的predict
函数为预测模型中每种类型的概率生成分数
[class, score] = predict(mdl, new_observation);