标签: apache-spark pyspark data-science distributed-computing databricks
我知道我们可以在spark中实现ARIMA模型,但是我找不到任何好的资源来学习如何在Pyspark中实现ARIMA模型以进行预测,或者我可以在SPARK中实现其他任何模型来进行预测更好的性能。请向我建议任何进一步研究的好资料。
答案 0 :(得分:0)
考虑使用由Sandy Ryza&Team创建的this开源软件包
Ref- https://github.com/sryza/spark-timeseries/blob/master/src/main/scala/com/cloudera/sparkts/models/ARIMA.scala