应用错误收集

所有scikit估计器都会自动处理多类问题。

内部将它们转换为适当的格式，如果该算法支持本机多类问题，则将其简单编码为0,1,2等，如果该算法通过transforming to binary处理多类问题，则将它们转换为单热编码。

请参阅the documentation来查看此内容：

所有scikit-learn分类器都可以进行多类分类，...

您可以看到“逻辑回归，多层感知器，高斯朴素贝叶斯和随机森林”位于标题"Inherently multiclass"下。

诸如SGD或LinearSVC之类的其他对象使用one-vs-rest方法来处理多类，但是正如我上面所说的那样，它将由scikit内部处理，因此您作为用户不需要做任何事情就可以通过所有分类估计量的y的单个数组中包含多个多类标签（甚至是字符串）。

用户唯一需要将标签显式转换为单热编码的方法是多标签问题，在该问题中，一个样本可以预测多个标签。但我认为您的问题与那无关。