我正在学习一些机器学习,目前正在学习决策树。 我想知道为什么如果决策树必须区分三个或更多可能的类别,杂质测量不是一个好的衡量标准。是不是因为随机性,像k-means聚类更好?
干杯
答案 0 :(得分:0)
两个类 const getByStatus = async (status) => {
const photo = await PhotoCodes.find({ status: status })
return photo .
}
router.post('/byStatus',async (req, res, next) => {
const status = req.body.status;
try {
const photo = await getByStatus(status)
if(photo.length!==0) {
return res.status(200).json({ result: 'ok', data: photo })
}
return res.status(404).json({message : "treat it as nothing was found"})
}
catch(error) {
return res.status(400).json({ result: 'ok', error: error })
}
});
的杂质度量,其中 P(A).P(B)
和 P(A)
都是 0 和 1 之间的分数。随着我们添加更多类 P(B)
,杂质度量将更多的分数相乘。当您将任何两个分数相乘时,您会得到一个小于其分量的数字。随着类数的增加,杂质度量变得越来越小,随着类增加到无穷大而接近于 0。
简而言之,杂质度量在多类分类问题中失去了意义,因为它变得太小而无法在决策树中正常运行。