标签: apache-spark machine-learning pyspark apache-spark-mllib
我有玩家和功能的数据,我需要根据每个玩家的功能为每个玩家创建不同的树。假设我们每个玩家有数百万行。
是否有可能以某种方式利用Spark MLlib?
我知道有一个选项可以在每次循环过滤不同的播放器中运行数据帧并使模型适合过滤后的数据,但这很慢并且不使用spark并行功能