应用错误收集

在pyspark中获取相关表单大集合

时间：2018-09-05 04:29:07

标签： python apache-spark pyspark statistics bigdata

如何获取大量数据的相关性？我无法使用这种方法，https://spark.apache.org/docs/2.2.0/ml-statistics.html，因为无法将正在处理的数据一次全部加载到内存中。

谢谢

0 个答案:

没有答案