我正在处理一个大型数据集(26 847个实例和16个功能)。这些功能有些是分类的,有些是数字的。我正在尝试使用此数据集运行“随机森林”合奏,但是,大多数分类功能所具有的功能远超过randomForests支持的类数量。建议我在这些功能上使用标签编码,因此,我使用CatEncoders软件包(code: lab_enc1 = LabelEncoder.fit(dataset$feature)
)。
我现在很难将标签编码标签与原始数据集中的相应特征相关联。我尝试使用“ use_labels
”包中的“ apply_labels
”和“ expss
”,出现此错误:
UseMethod(“ apply_labels”)中的错误: 没有将适用于“ apply_labels”的适用方法应用于“ factor”类的对象
关于如何解决此错误的任何建议?