S3的解压缩文件失败,不确定原因

时间:2015-02-24 05:03:49

标签: node.js amazon-s3 tar aws-sdk node.js-stream

(以下新信息) 我正在尝试设置一个lambda函数,通过解压缩并将结果写回S3,对上传的tgz文件作出反应。解压缩和解压缩工作正常,但上传到S3失败:

/Users/russell/lambda/gzip/node_modules/aws-sdk/lib/s3/managed_upload.js:350
    var buf = self.body.read(self.partSize - self.partBuffer.length) ||
                        ^
TypeError: undefined is not a function
    at ManagedUpload.fillStream (/Users/russell/lambda/gzip/node_modules/aws-sdk/lib/s3/managed_upload.js:350:25)
    at Entry.<anonymous> (/Users/russell/lambda/gzip/node_modules/aws-sdk/lib/s3/managed_upload.js:167:28)
    at Entry.emit (events.js:104:17)
    at Entry._read (/Users/russell/lambda/gzip/node_modules/tar/lib/entry.js:123:12)
    at Entry.end (/Users/russell/lambda/gzip/node_modules/tar/lib/entry.js:82:8)
    at Parse._process (/Users/russell/lambda/gzip/node_modules/tar/lib/parse.js:107:13)
    at BlockStream.<anonymous> (/Users/russell/lambda/gzip/node_modules/tar/lib/parse.js:47:8)
    at BlockStream.emit (events.js:107:17)
    at BlockStream._emitChunk (/Users/russell/lambda/gzip/node_modules/tar/node_modules/block-stream/block-stream.js:145:10)
    at BlockStream.write (/Users/russell/lambda/gzip/node_modules/tar/node_modules/block-stream/block-stream.js:45:10)

当我写入S3时会发生此错误,但如果我将文件本地写入磁盘则会起作用,因此管道是正确的。

以下是演示此问题的代码:

var aws = require('aws-sdk');
var s3 = new aws.S3({apiVersion: '2006-03-01'});
var zlib = require('zlib');
var tar = require('tar');
var fstream = require('fstream');

fstream.Reader({'path': 'testdata.tar.gz'})
    .pipe(zlib.Unzip())
    .pipe(tar.Parse())
    .on('entry', function(entry) {
        var filename = entry.path;
        console.log('got ' + entry.type + ' ' + filename);
        if (entry.type == 'File') {
            if (1) { // switch between working and nonworking cases
                s3.upload({Bucket: 'my_bucket', Key: 'gunzip-test/' + filename, Body: entry}, {},
                          function(err, data) {
                              if (err) 
                                  console.log('ERROR!');
                              else
                                  console.log('OK');
                          });
            }
            else {
                entry.pipe(fstream.Writer({ 'path': '/tmp/mytest/' + filename }));
            }
        }
    });

如果代码设置为写入S3,则会因上述错误而失败,如果它在本地写入提取的文件则成功。 ENTRY是一个流,并且根据doc应该在上传Body参数中接受。我在ManagedUpload中放了一个print语句,失败来了,并确认self.body是一个流:

var stream = require('stream');
console.log('is it a stream? ' + ((self.body instanceof stream) ? 'yes' : 'no'));
console.log('self.body.read is ' + self.body.read);

返回

$ got File gunzip.js
is it a stream? yes
self.body.read is undefined

我对aws和node.js很新,所以可能存在一个基本问题,但是我已经花了一天时间而没有找到它。我使用unzip而不是gzip进行了上传调用,并且它有效(using lambda functions to unzip archives in S3 is really sloooooow)任何人都可以指出我在这段代码中做错了什么吗?

由于


我想我更了解这一点。我将管道分成碎片,看着每一个。问题是tar.Parse使用fstream而不是stream。如果我查看.pipe(tar.Parse())语句的返回它是一个流,但它不是stream.Readable或stream.Writable。 fstream没有定义read()方法(它的读者基于Stream,它不是stream.Readable),所以基于Stream的tar.Parse也没有。

问题的改进是,这是fstream中的一个错误,还是fstream不是一个流?我认为这是一个错误 - 来自自述文件:

&#34;与FS流一样,但有关于它们的统计数据,以及支持目录和 符号链接,以及普通文件。此外,您可以使用它来设置 文件中的统计信息,即使您不更改其内容或创建 符号链接等&#34;

2 个答案:

答案 0 :(得分:14)

在我的案例中,通过stream.PassThrough运行流已帮助。

var PassThrough = require('stream').PassThrough;

var stream = getStreamSomeHow();
var passthrough = new PassThrough();

stream.pipe(passthrough);

s3.upload({...,Body:passthrough}) // 

答案 1 :(得分:-1)

你的body变量是一个Stream对象,在这种情况下你需要使用.toString()

var aws = require('aws-sdk');
var s3 = new aws.S3({apiVersion: '2006-03-01'});
var zlib = require('zlib');
var tar = require('tar');
var fstream = require('fstream');

fstream.Reader({'path': 'testdata.tar.gz'})
    .pipe(zlib.Unzip())
    .pipe(tar.Parse())
    .on('entry', function(entry) {
        var filename = entry.path;
        console.log('got ' + entry.type + ' ' + filename);
        if (entry.type == 'File') {
            if (1) { // switch between working and nonworking cases
                s3.upload({Bucket: 'my_bucket', Key: 'gunzip-test/' + filename, Body: entry.toString()}, {},
                          function(err, data) {
                              if (err) 
                                  console.log('ERROR!');
                              else
                                  console.log('OK');
                          });
            }
            else {
                entry.pipe(fstream.Writer({ 'path': '/tmp/mytest/' + filename }));
            }
        }
    });