标签: r apache-spark hadoop mars
是否可以使用Hadoop上的Earth库或Spark来实现MARS算法?输入为1 TB数据,预计输出为10 TB数据。 这个问题是在求职面试中提出的。我在R和统计方面有相当的经验,但是我缺乏海量数据集的经验,所以我希望有人可以给我一些有关该问题的见解。