Gmail工作时无法使用JavaMail读取Outlook邮件

时间:2012-12-20 11:26:43

标签: java email outlook gmail javamail

基本上,我写了一个从收件箱中读取电子邮件的应用程序。我一直在用Gmail发送的电子邮件测试应用程序。但是现在当我尝试阅读从Outlook发送的电子邮件时,我没有收到任何内容。

我从两封电子邮件中记录了内容类型: Gmail返回:multipart/alternative; boundary=047d7b342bf2b6847f04d11df78a Outlook返回:text/html; charset=iso-8859-1 注意:这些是相同的电子邮件,只是从不同的邮件客户端发送。

来自Gmail的邮件将是Multipart的一个实例。而Outlook电子邮件将是String的实例。

我的代码:

检查消息是否是Multipart或String的实例的方法。

public void getContent(Message msg) throws IOException, Exception {

    Object contt = msg.getContent();
    System.out.println("Contenttype: " + msg.getContentType());

    if (contt instanceof Multipart) {
        checkDisposition = true;
        handleMultipart((Multipart) contt);
    } else if (contt instanceof String) {   
       handlePart((Part) msg);
    }
    prepareEmail(mpMessage);
}

如果消息是multipart,则会调用此方法:

public void handleMultipart(Multipart multipart)
        throws MessagingException, IOException, Exception {
    mpMessage = getText(multipart.getBodyPart(0));

    for (int z = 1, n = multipart.getCount(); z < n; z++) {
        handlePart(multipart.getBodyPart(z));

    }
}

如果消息不是,则会直接调用:

public void handlePart(Part part)
        throws MessagingException, IOException, Exception {



    Object con = messageCopy.getContent();

    String disposition = part.getDisposition();
    String contentType = part.getContentType();

    if (checkDisposition) {


        if (disposition == null) {

            System.out.println("Disposition is null");

        } else if (disposition.equalsIgnoreCase(Part.ATTACHMENT)) {
            System.out.println("Attachment: " + part.getFileName()
                    + " : " + contentType);
            input = part.getInputStream();
            bytes = IOUtils.toByteArray(input);
        } else if (disposition.equalsIgnoreCase(Part.INLINE)) {
            System.out.println("Inline: "
                    + part.getFileName()
                    + " : " + contentType);
        } else {
            System.out.println("Other: " + disposition);
        }
    }else{
        mpMessage = part.getContent().toString(); //returns nothing



        System.out.println("mpMessage handlePart "+mpMessage); //returns nothing
        System.out.println("mpMessage handlePart "+part.getLineCount()); //returns 0
        System.out.println("mpMessage handlePart "+part.getContentType()); //returns text/html chartset=iso-8859-1
        System.out.println("mpMessage handlePart "+part.getSize()); // returns 22334
        part.writeTo(System.out); //See below

    }

}

从部分返回文本的方法:

private String getText(Part p) throws
        MessagingException, IOException {

    System.out.println("getText contentType "+p.getContentType());

//This part gets called if trying to read an Outlook mail, its not clear for me how to  retrieve the text from the part. Since `p.getContent()` returns nothing
    if (p.isMimeType("text/*")) {
        String s = (String) p.getContent();
        System.out.println();
        return String.valueOf(s);
    }

    if (p.isMimeType("multipart/alternative")) {
        Multipart mp = (Multipart) p.getContent();
        String text = null;
        for (int i = 0; i < mp.getCount(); i++) {
            Part bp = mp.getBodyPart(i);
            if (bp.isMimeType("text/plain")) {
                String s = getText(bp);
                if (s != null) {
                    return s;
                }
            }
        }
        return text;
    }
    return null;
}

part.writeTo(System.out)返回:

收到:来自AMSPRD0710HT005.eurprd07.prod.outlook.com  服务器(TLS)id 00000;星期四,2012年12月20日09:28:23 +0000 收到:来自AMSPRD0710MB354.eurprd07.prod.outlook.com([00.000.0000])by  AMSPRD0710HT005.eurprd07.prod.outlook.com([00.000.0000])with mapi id  14.16.0245.002;星期四,2012年12月20日09:28:05 +0000 来自:测试 支持 主题:Verwerkingsverslag Kenmerk:0824496 主题:Verwerkingsverslag Kenmerk:0824496 线程索引:Ac3elFC2qYsSo + SOT2ii4HnbCCqgVw == 日期:星期四,2012年12月20日10:28:05 +0100 邮件ID:...

等等。

消息本身的内容将作为HTML代码返回,而不仅仅是普通文本。

如何从Outlook电子邮件中检索纯文本,而不是HTML代码?或者如何在handlePart中检索零件的内容?

感谢任何帮助,

谢谢!

1 个答案:

答案 0 :(得分:2)

您似乎假设Outlook使用HTML版本发送纯文本,但似乎并非如此。您从Outlook记录的电子邮件的MIME类型为text/html,表示它只是一个HTML格式的文档。另一方面,Gmail版本发送了multipart/alternative文档,该文档可能表明同一文档中有多个版本的电子邮件(纯文本和HTML) - 我认为这是Gmail的默认行为)。因此,如果您获得HTML编码版本,您将收到电子邮件的“文本”,就像它发送一样。

不要求使用纯文本版本或实际上使用任何其他格式发送电子邮件。您可以确保邮件客户端以您的消费程序可以处理的格式发送电子邮件,或者更改消费程序以处理正在发送的格式。

除上述内容外,您可能还想重新考虑这一行:

mpMessage = getText(multipart.getBodyPart(0));

这似乎假设多部分消息的第一部分将是纯文本文档和消息的文本。这可能是一个不好的假设。


因此,假设您确实收到了包含HTML内容的邮件,getContent()不应该返回null或空字符串。应根据documentation on MimeBodyPart#getContent()返回InputStream。阅读InputStream应该可以生成带有HTML标记的字符串。

由于您似乎并不关心HTML,而只关心内容,因此只需使用Java Jsoup等Java HTML解析库即可大大简化该过程。基本上,您可以通过将getText()更改为以下内容将其集成到当前代码中:

private String getText(Part p) throws MessagingException, IOException {
    System.out.println("getText contentType "+p.getContentType());
    if (p.isMimeType("text/plain")) {
        String s = (String) p.getContent();
        System.out.println(s);
        return s;
    } else if (p.isMimeType("text/html")) {
        // the last two parameters of this may need to be modified
        String s = Jsoup.parse(p.getInputStream(), null, null).text();
        System.out.println(s);
        return s;
    } else if (p.isMimeType("multipart/alternative")) {
        Multipart mp = (Multipart) p.getContent();
        String text = "";
        for (int i = 0; i < mp.getCount(); i++) {
            Part bp = mp.getBodyPart(i);
            if (bp.isMimeType("text/*")) {
                String s = getText(bp);
                if (s != null) {
                    text += s;
                }
            }
        }
        return text;
    }
    return null;
}

请注意,这假设电子邮件足够小,可以在内存中完全读取和解析。