标签: emr amazon-emr
我有一个可执行文件,我已经包装在一个docker镜像中。我需要从我的spark作业中调用它,等待它生成一个输出文件,然后将该文件加载到RDD中。
我应该使用pipe方法吗?如何确保EMR主站上的docker可用?
pipe