针对S3的oozie fs操作未更新S3存储的清单(DynamoDB Metastore-emrfs不同步)中的密钥

时间:2018-09-03 10:10:53

标签: hadoop amazon-s3 oozie amazon-emr oozie-workflow

从理论上讲,使用HDFS CLI运行hdfs命令时,

hdfs dfs -touchz s3://bucketname/folder/file

它通过EMRFS,并在创建S3条目时更新dynamodb中MANIFESTS中的密钥。

emrfs diff-在S3和MANIFESTS(Dynamodb)中都说。到目前为止一切都很好。

当我尝试对s3文件运行以下oozie fs操作时,由于没有在MANIFESTS(dynamodb)中看到按键,我注意到该操作不是通过EMRFS发生的。

emrfs diff-说,文件在S3中,但不在MANIFESTS(Dynamodb)中。

<action name="fs_action">
    <fs>
    <name-node>${nameNode}</name-node>
        <touchz path='folder/file'/>
    </fs>
</action>

只是想知道oozie fs动作是否正在从oozie服务器本身运行时在屏幕后面使用emrfs。只是想了解oozie fs针对s3的屏幕背后发生了什么?

谢谢。

1 个答案:

答案 0 :(得分:0)

Oozie是不使用EMRFS与S3进行交互的Hadoop应用程序之一。

  

EMR ­上有一些应用程序(例如Presto和Oozie)可以   不使用EMRFS与S3交互

EMRFS