标签: scala apache-spark pyspark apache-spark-sql amazon-emr
我想分享我在Scala中创建的udfs与我们的数据科学家在EMR集群中使用pyspark和jupyter的其他集群。
这可能吗?怎么样?
答案 0 :(得分:0)
this answer确实有帮助
创建一个超级jar,放入s3,在bootstrap动作上从s3到它本地jar文件夹,它应该工作