我想知道是否有任何算法可以逐步向现有的分类器系统添加新类。对于例如如果我已经培训了一个包含50个类别的系统,并且我想在系统中添加另外10个类别,我应该研究哪些方法?有广泛的算法允许使用现有类别的额外训练样本逐步更新系统,但我不知道允许添加更多类别的方法。从理论上讲,我认为像算法这样的最近邻可以应用于这个任务,但是还有其他适用于大规模任务的算法(比如更新一个训练有500个类别和50个额外类别的系统吗?可能属于增量决策树的领域?增量SVM等算法对于大量类别的扩展性不是很好。如果有任何纸张/代码,我会很感激指向它。
答案 0 :(得分:0)
如果我正确理解了您的问题,您就会询问有关分裂的群集(您有一组给定的数据,并希望使用比以前更多的群组重新群集它们。)
我熟悉的大多数算法都需要从头开始重新构建群集。但是,您可能希望查看BIRCH算法。由于它只存储类的摘要(没有明确的数据引用),因此a)适用于Big Data™,b)它具有一种距离度量,可以告诉您接下来要分割的类别(如果你想要动态生成额外的50"最不同的"类别)。