当我看到机器学习,特别是分类时,我发现某些算法被设计用于对决策树进行分类,以便在没有考虑的情况下进行分类,如下所述:
对于两类问题,类别A和B,人们对特殊问题感兴趣,例如类别A.对于这种情况,假设我们有100个A和1000个B。一个好的分类可能有一个混合100A和100B作为一部分的结果让900B另一部分。这对分类很有用。但是有没有算法可以选择50A和5B作为一个部分,50A和995B作为另一部分。这可能不如分类视图那么好,但如果某人对A类感兴趣,我认为下一个算法可以给出更纯粹的A结果,因此它更好。
简而言之,这意味着是否有一种算法可以纯粹的特殊类别,而不是对它们进行无偏见的分类?
如果scikit-learn包含了这个算法,那就更好了。
答案 0 :(得分:0)
如果我理解正确,我认为您要求的机器学习算法会给某些类别带来更高的权重,因此更有可能预测那些特殊的"特殊的"类。
如果您要问的是什么,您可以使用任何算法在预测期间输出每个类的概率。我认为大多数算法实际上采用了这种方法,但我特别知道神经网络会这样做。然后,您可以按比例在"特殊"类,或手动后处理预测输出(每个类的概率数组),以使概率适应您的规范。