Gmail API解码Javascript中的邮件

时间:2014-07-17 18:32:39

标签: javascript email character-encoding decoding gmail-api

我在解码使用Gmail API收到的电子邮件的邮件正文时遇到严重问题。我想抓取消息内容并将内容放在div中。我正在使用base64解码器,我知道它不会解码编码不同的电子邮件,但我不知道如何检查电子邮件以决定使用哪个解码器 - 说明它们是utf-8编码的电子邮件已成功解码通过base64解码器,但不是utf-8解码器。

我现在已经研究了几天的电子邮件解码,而且我已经了解到我在这里的联盟有点不合时宜。我之前没有做过很多关于电子邮件编码的工作。这是我用来收到电子邮件的代码:

gapi.client.load('gmail', 'v1', function() {
var request = gapi.client.gmail.users.messages.list({
  labelIds: ['INBOX']
});
request.execute(function(resp) {
  document.getElementById('email-announcement').innerHTML = '<i>Hello! I am reading your <b>inbox</b> emails.</i><br><br>------<br>';
  var content = document.getElementById("message-list");
  if (resp.messages == null) {
    content.innerHTML = "<b>Your inbox is empty.</b>";
  } else {
    var encodings = 0;
    content.innerHTML = "";
    angular.forEach(resp.messages, function(message) {
      var email = gapi.client.gmail.users.messages.get({
      'id': message.id
      });
      email.execute(function(stuff) {
        if (stuff.payload == null) {
          console.log("Payload null: " + message.id);
        }
        var header = "";
        var sender = "";
        angular.forEach(stuff.payload.headers, function(item) {
          if (item.name == "Subject") {
            header = item.value;
          }
          if (item.name == "From") {
            sender = item.value;
          }
        })
        try {
          var contents = "";
          if (stuff.payload.parts == null) {
            contents = base64.decode(stuff.payload.body.data);
          } else {
            contents = base64.decode(stuff.payload.parts[0].body.data);
          }
          content.innerHTML += '<b>Subject: ' + header + '</b><br>';
          content.innerHTML += '<b>From: ' + sender + '</b><br>';
          content.innerHTML += contents + "<br><br>";
        } catch (err) {
          console.log("Encoding error: " + encodings++);
        }
      })
    })
  }
 });
});

我正在执行一些检查和调试,因此剩下的console.log和其他一些仅用于测试的东西。不过,你可以在这里看到我想要做的事情。

解码我从Gmail API中提取的电子邮件的最佳方法是什么?我是否应该尝试将电子邮件放入<script>charsettype属性与电子邮件的编码内容相匹配?我相信我记得charset只适用src属性,我不会在这里。有什么建议吗?

7 个答案:

答案 0 :(得分:16)

对于我正在编写的原型应用程序,以下代码对我有用:

var base64 = require('js-base64').Base64;
// js-base64 is working fine for me.

var bodyData = message.payload.body.data;
// Simplified code: you'd need to check for multipart.

base64.decode(bodyData.replace(/-/g, '+').replace(/_/g, '/'));
// If you're going to use a different library other than js-base64,
// you may need to replace some characters before passing it to the decoder.

警告:这些要点没有明确记录,可能是错误的:

  1. users.messages: get API默认返回“已解析的正文内容”。无论Content-TypeContent-Transfer-Encoding标头如何,此数据似乎始终以UTF-8和Base64编码。

    例如,我的代码在解析包含以下标题的电子邮件时没有问题:Content-Type: text/plain; charset=ISO-2022-JPContent-Transfer-Encoding: 7bit

  2. Base64编码varies among various implementations的映射表。 Gmail API使用-_作为表格的最后两个字符,由RFC 4648的“URL和文件名安全字母” 1 定义。< / p>

    检查您的Base64库是否使用不同的映射表。如果是这样,请将这些字符替换为您的库接受的字符,然后再将正文传递给解码器。


  3. 1 文档中有一条支持线:the "raw" format返回“body content as base64url encoded string”。 (谢谢埃里克!)

答案 1 :(得分:3)

使用atob解码JavaScript中的消息(请参阅ref)。要访问消息有效负载,可以编写一个函数:

var extractField = function(json, fieldName) {
  return json.payload.headers.filter(function(header) {
    return header.name === fieldName;
  })[0].value;
};
var date = extractField(response, "Date");
var subject = extractField(response, "Subject");

从我之前的SO Question

引用
var part = message.parts.filter(function(part) {
  return part.mimeType == 'text/html';
});
var html = atob(part.body.data);

如果以上内容无法100%正确解码,@ cgenco对以下此答案的评论可能适用于您。在那种情况下,做

var html = atob(part.body.data.replace(/-/g, '+').replace(/_/g, '/'));

答案 2 :(得分:2)

以下是解决方案: Gmail API - &#34; Users.messages:get&#34;方法有响应message.payload.body.data parted base64 data,它由&#34; - &#34;分隔。符号。它不是整个base64编码的文本,它是base64文本的一部分。你必须尝试解码它的每一部分或通过联合制作一个单声道字符串并替换&#34; - &#34;符号。在此之后,您可以轻松地将其解码为人类文本。 您可以在此处https://www.base64decode.org

手动检查每个部分

答案 3 :(得分:1)

请使用网络安全解码器解码Gmail电子邮件和附件。当我只使用base64decoder时,我得到了空白页,必​​须使用它:https://www.npmjs.com/package/urlsafe-base64

答案 4 :(得分:1)

这一点我也很生气。我通过查看VSCode的扩展找到了解决方案。解决方法非常简单:

let body = response.data.payload.body; // the base64 encoded body of a message
 body = new Buffer.alloc(
        body.data.length,
        body.data,
        "base64"
      ).toString();  // the decoded message

当我使用Gmail API的gmail.users.messages.get()调用时,它为我工作。

答案 5 :(得分:0)

我可以使用https://simplycalc.com/base64-decode.php

上的其他工具轻松解码

在JS中:https://www.npmjs.com/package/base64url

在Python 3中:

import base64
base64.urlsafe_b64decode(coded_string)

答案 6 :(得分:0)

谢谢@ento的回答。我将详细解释为什么在解码之前需要将“-”和“ _”字符替换为“ +”和“ /”。

Wiki Base64 Variants summary table显示:

  • RFC 4648 第4部分 base64 (标准):使用'+'和'/'
  • RFC 4648 第5部分 base64url (URL安全和文件名安全标准):使用'-'和'_'

简而言之,Gmail API使用 base64url (urlsafe)格式(“-”和“ _”),但是JavaScript atob函数或其他 JavaScript库使用 base64 (标准)格式(“ +”和“ /”)。

对于Gmail API,文档说正文使用base64url格式,请参见以下链接:

有关Web atob / btoa标准,请参见以下链接: