需要一些指导。
我面临的挑战是需要将python脚本以及python脚本生成的所有文件夹/子文件夹和文件放在hdfs中,而不是本机linux文件系统中。
我不希望在oozie调度中使用SSH Action扩展(http://archive.cloudera.com/cdh5/cdh/5/oozie/DG_SshActionExtension.html),我想知道将所有内容放入hdfs的方法是否有效。基本上,我需要知道如果所有内容(包括输出)都存储在hdfs中并使用oozie调用,以下任务是否可以发布挑战:
使用oozie调度生成本地文件系统输出的python脚本的最佳方法是什么?是通过将python脚本存储在edgenode中并使用SSH Action重定向Oozie在edgenode中查找该脚本来实现的?