[Nodejs] [AWS-SDK]从AWS S3存储桶读取HTML文件

时间:2019-05-10 12:38:19

标签: node.js aws-sdk backslash

我使用aws-sdk在s3上获取对象。代码是:

const params = {
    Bucket: event.Records[0].s3.bucket.name,
    Key: event.Records[0].s3.object.key,
   };
  const data = await s3.getObject(params).promise();
  const html = data.Body.toString();

但是html的结果是:

 consolo.log(html) 
 ->
<!DOCTYPE html>\n<!-- saved from url=(0042)https:/
/www.linkedin.com/in/jeromedevosse/ -->\n<html lang=\"en\" class=\"gr__linkedin_com\">

我们可以看到html中有很多换行符“ \ n”和反斜杠“ \”。

现在,我使用正则表达式替换它们,

const html = data.Body.toString().replace(/\\|\\n/g,'');

但是有没有更好的解决方案?

1 个答案:

答案 0 :(得分:0)

我偶然发现了相同的问题,但这是由于在检查结果之前我正在使用JSON.stringify。您可以检查类似的内容,也许可以尝试使用JSON.parse(html);