在EMR中为使用AWS客户端主密钥加密的数据运行presto查询时的解密问题

时间:2015-05-19 13:12:36

标签: encryption amazon-s3 hive emr presto

我使用了您在Amazon EMR实例上成功安装presto服务器(版本0.99)和java 8的最新脚本。我的数据文件位于使用加密的客户端客户管理密钥加密的s3存储桶中。当我创建一个引用s3中的加密数据文件的hive表时,hive可以成功解密记录并在控制台中显示它。但是,从presto命令行界面查看同一外部表时,数据以加密形式显示。我查看了你的链接:
https://prestodb.io/docs/current/release/release-0.57.html
并在我的hive.properties文件中添加了这些属性,如下所示。

hive.s3.connect-timeout=2m
hive.s3.max-backoff-time=10m
hive.s3.max-error-retries=50
hive.metastore-refresh-interval=1m
hive.s3.max-connections=500
hive.s3.max-client-retries=50
connector.name=hive-hadoop2
hive.s3.socket-timeout=2m
hive.s3.aws-access-key=***
hive.s3.aws-secret-key=**
hive.metastore.uri=thrift://localhost:9083
hive.metastore-cache-ttl=20m
hive.s3.staging-directory=/mnt/tmp/
hive.s3.use-instance-credentials=true

非常感谢任何有关如何使用presto cli解密文件的帮助。

1 个答案:

答案 0 :(得分:0)

我们会在您提交的问题中跟进:https://github.com/facebook/presto/issues/2945