如果决策树必须区分三个或更多可能的类别,为什么杂质测量不是一个好的衡量标准?

时间:2017-04-07 09:07:02

标签: java machine-learning decision-tree

我正在学习一些机器学习,目前正在学习决策树。 我想知道为什么如果决策树必须区分三个或更多可能的类别,杂质测量不是一个好的衡量标准。是不是因为随机性,像k-means聚类更好?

干杯

1 个答案:

答案 0 :(得分:0)

两个类 const getByStatus = async (status) => { const photo = await PhotoCodes.find({ status: status }) return photo . } router.post('/byStatus',async (req, res, next) => { const status = req.body.status; try { const photo = await getByStatus(status) if(photo.length!==0) { return res.status(200).json({ result: 'ok', data: photo }) } return res.status(404).json({message : "treat it as nothing was found"}) } catch(error) { return res.status(400).json({ result: 'ok', error: error }) } }); 的杂质度量,其中 P(A).P(B)P(A) 都是 0 和 1 之间的分数。随着我们添加更多类 P(B),杂质度量将更多的分数相乘。当您将任何两个分数相乘时,您会得到一个小于其分量的数字。随着类数的增加,杂质度量变得越来越小,随着类增加到无穷大而接近于 0。

简而言之,杂质度量在多类分类问题中失去了意义,因为它变得太小而无法在决策树中正常运行。