AWS S3-以八位字节流的形式获取PDF并上传到S3存储桶

时间:2019-02-26 05:56:43

标签: node.js amazon-web-services amazon-s3 request-promise octetstring

我正在从第三方API提取PDF。响应内容类型为application/octet-stream。之后,我将其上传到S3,但是如果我去S3并下载新编写的文件,则内容不可见,页面为空白,可以在Chromium和Adobe Acrobat中查看。该文件也不是零字节,并且具有正确的页数。

使用二进制编码可以使我的文件大小最接近实际文件大小。但这仍然不准确,它略小。

API请求(使用request-promise模块):

import { get } from 'request-promise';

const payload = await get('someUrl').catch(handleError);

const buffer = Buffer.from(payload, 'binary');
const result = await new S3().upload({
  Body: buffer,
  Bucket: 'somebucket',
  ContentType: 'application/pdf',
  ContentEncoding: 'binary',
  Key: 'somefile.pdf'
}).promise();

此外,从Postman下载文件还会导致文件空白。有人知道我在哪里错吗?

1 个答案:

答案 0 :(得分:0)

正如@Micheal-注释中提到的sqlbot一样,下载是问题所在。我没有从API获得整个字节流。

更改const payload = await get('someUrl').catch(handleError);

import * as request from 'request'; // notice I've imported the base request lib 

let arrayBuffer = [];

request.get('someUrl')
.on('response', (res) => {

  res.on('data', (chunk) => {
    bufferArray = bufferArray.concat(Buffer.from(chunk)); //save response in a temp array for now
  });

  .on('end', () => {
    const dataBuffer = Buffer.concat(bufferArray); //this now contains all my data
    //send to s3
  });
});

注意:不建议使用request-promise库流式传输响应-文档中已概述。我改用了基础request库。

https://github.com/request/request-promise#api-in-detail