我的sparklyr数据帧中有很多列(大约70列),在我使用sparklyr的xgboost_classifier函数构建xgboost模型之前,其中一些列需要进行热编码。但是我不知道要使用哪个one_hot函数,为什么?
我知道ft_string_indexer的工作原理,并且已经将它与one_hot_encoder函数结合使用,但是我得到的列没有多大意义。
这是返回的列。 xgboost_classifier可以用吗?
1 <dbl [5]>
2 <dbl [5]>
3 <dbl [5]>
4 <dbl [5]>
5 <dbl [5]>
6 <dbl [5]>
7 <dbl [5]>