在pyspark中获取相关表单大集合

时间:2018-09-05 04:29:07

标签: python apache-spark pyspark statistics bigdata

如何获取大量数据的相关性?我无法使用这种方法,https://spark.apache.org/docs/2.2.0/ml-statistics.html,因为无法将正在处理的数据一次全部加载到内存中。

谢谢

0 个答案:

没有答案