AWS Databricks配置

时间:2017-10-02 08:16:46

标签: amazon-web-services

我想使用AWS(亚马逊)使用Databricks在线IDE导入/导出我的数据,但我是初学者,我不知道如何开始!

提前致谢 安东尼奥

1 个答案:

答案 0 :(得分:0)

这样做的一种方法是首先安装S3存储桶:

dbutils.fs.mount('s3a://<s3_key_id>:<s3_secret_key>@<your_bucket_name>', '/mnt/some_path')

然后你应该能够导入/导出你的数据: df.write.csv(path =&#39; / mnt / some_path /,header = True)

或者您可以将文件保存到本地文件系统,然后上传到S3:

dbutils.fs.cp('/local_path/filename', 's3a://<s3_key_id>:<s3_secret_key>@<your_bucket_name/filename')