标签: python machine-learning scikit-learn categorical-data
我刚刚读了这篇this documentation帖子,作者指出:
由于数据框具有许多(50+)列,我想避免创建一个 每列LabelEncoder个对象;我宁愿只有一个大 LabelEncoder个对象可用于所有我的数据列。
LabelEncoder
这样做明智吗?为什么?
对我来说,对带有分类数据的数据框的每一列分别使用LabelEncoder更为自然。
在特定列中遇到看不见的数据时,会发生什么情况(对于所有列中的LabelEncoder而言)?