如何将一列数据帧映射到Apache Spark Scala中的另一列?

时间:2018-05-11 17:29:53

标签: scala apache-spark

我已经从CSV文件创建了一个数据框。它有10列,其中两列是女演员和电影片名。我想把女演员作为一个关键和标题作为一个价值,并进一步希望通过键减少它来获得每个女演员的电影列表。对于这种情况,我必须首先将actress列映射到电影标题列。那么如何在Spark scala中获得女演员,电影平铺键值对的元组。此外,我想使用基本操作而不是SparkSQL来完成它。

1 个答案:

答案 0 :(得分:-1)

建议:问题质量低,你应该首先在网上查找示例然后

val df = ???

com.gemstone.gemfire.InternalGemFireException: java.io.NotSerializableException: com.gemfire.poc.DomainObjects.Customer

希望这有帮助,干杯