编写一个Apache Spark程序来投影人寿保险政策

时间:2018-08-26 20:31:00

标签: apache-spark apache-spark-sql

我目前正在考虑使用Apache Spark对某些人寿保险单进行计算的选项。下面提供了数据输入和所需输出的简化版本。

Spark Life insurance transformation

在实现Spark集群上的并行计算的全部好处的同时,我可以考虑使用哪些选项来实现这种类型的转换?

换句话说,我的要求是每个月计划每个月的特定时间。在预测过程中,需要计算多种因素,包括随着时间的推移而增加的保费和保额。理想的方法是应用一些函数(例如称为ProjectPolicies),该函数根据输入数据进行所有计算并返回输出数据框。如果此选项不可用,我需要知道是否可以在执行计算的函数中写入输出(例如,在ProjectPolicies中写入输出)。是否可以在函数内创建和输出数据帧?推荐的输出选项是什么?

我将欣赏答案中的一些代码示例,以帮助我清楚地了解如何在Spark中应用它。

在此先感谢您的帮助!

0 个答案:

没有答案