pyspark ML管道-我可以将RFormula用于多个polyFeatures吗?

时间:2018-06-28 13:56:48

标签: pyspark apache-spark-ml

我想在pyspark中做polyFeatures。 我看到该交互在python API(https://spark.apache.org/docs/latest/ml-features.html#interaction)中不可用, 所以我想到了使用RFormula。 问题是我想向算法提供几套polyFeature。 即-如果我有a,b,c,d,e,f,g,h列-我想创建要素矢量列 没有ac,bd,fe,gh组合。 例如:

ToList()

我怎么做,因为我不能在同一管道中两次调用RFormula,即使可以,公式中的目标是什么?

0 个答案:

没有答案