标签: pyspark spark-streaming pca apache-spark-ml
只是想知道,我们如何在分布式模式下对流数据进行主成分分析?如果可以的话,它在数学上是否足够有效?
有人做过吗?你们可以分享您的经验吗? Spark提供了API在Spark Streaming模式下做同样的事情吗?