标签: apache-spark
进行基本决策培训时出现以下错误:
需求失败:DecisionTree要求maxBins(= 32)至少与每个分类要素中的值数量一样大,但分类要素0具有995个值。
通过设置maxBins,我可以解决此错误。但是,我已经使用带有maxCategories = 20的vectorIndexer转换了所有功能。为何仍然存在具有995个值的分类特征?该功能不应该已经被视为连续值了吗?