我正在开发一个包含大量类(约3500)的多类模型。大量的类可以影响我的模型的性能吗?我想使用SVM和随机森林。有谁知道这些方法的类数量是否有任何限制? 提前致谢
答案 0 :(得分:2)
是的,它可能会受到性能影响,特别是因为大多数库通过使用二进制问题的组合来解决多类问题。有不同的策略(一对一,一对一,赢者通吃等),你必须尝试看看哪个表现得足够好(假设你有控制权)。
https://en.wikipedia.org/wiki/Support_vector_machine#Multiclass_SVM
过去有时对我有用的肮脏黑客,就是将问题视为回归问题而不是多类问题,但这可能在您的情况下无效,我必须详细查看问题告诉你。