使用scala从s3存储桶下载所有文件

时间:2018-03-05 18:16:40

标签: scala amazon-s3

我尝试使用以下代码成功下载一个文件,但无法下载所有文件列表

client.getObject(
new GetObjectRequest(bucketName, "TestFolder/TestSubfolder/Psalm/P.txt"),
new File("test.txt"))          

提前致谢

更新 我尝试了以下代码,但获取目录列表,我想要文件列表

val listObjectsRequest = new ListObjectsRequest().
withBucketName("tivo-hadoop-dev").
withPrefix("prefix").
withDelimiter("/")
client.listObjects(listObjectsRequest).getCommonPrefixes

2 个答案:

答案 0 :(得分:2)

我不知道为什么人们对这个问题投反对票。这是一件简单的事情,但在结束下面提到的答案之前,我就像任何事情一样挣扎。
我找到了一个java代码并相应地更改为scala并且它有效 希望它会帮助别人。如果有人有更好更简单的答案请帮助

 val client = new AmazonS3Client(credentials)
         val listObjectsRequest = new ListObjectsRequest().
         withBucketName("bucket-name").
         withPrefix("path/of/dir").
         withDelimiter("/")

 var objects = client.listObjects(listObjectsRequest);
 do {
     for (objectSummary <- objects.getObjectSummaries()) {
         var key = objectSummary.getKey()
                 println(key)
                 var arr=key.split("/")
                 var file_name = arr(arr.length-1)
                 client.getObject(
                         new GetObjectRequest("bucket" , key),
                         new File("some/path/"+file_name))
     }
     objects = client.listNextBatchOfObjects(objects);
 } while (objects.isTruncated())

答案 1 :(得分:0)

以下代码快速且有用,尤其是当您要在特定本地目录中下载所有对象时。它将文件保留在完全相同的s3前缀层次结构下

val xferMgrForAws:TransferManager = TransferManagerBuilder.standard().withS3Client(awsS3Client).build();
var objectListing:ObjectListing = null;
objectListing = awsS3Client.listObjects(awsBucketName, prefix);
val summaries:java.util.List[S3ObjectSummary] = objectListing.getObjectSummaries();
if(summaries.size() > 0) {
  val xfer:MultipleFileDownload = xferMgrForAws.downloadDirectory(awsBucketName, prefix, new File(localDirPath));
  xfer.waitForCompletion();
  println("All files downloaded successfully!")
} else {
   println("No object present in the bucket !");
}