阅读Outlook .msg文件

时间:2013-04-08 11:13:22

标签: java email outlook apache-poi

我正在尝试使用Apache POI包编写代码来读取Outlook .msg邮件文件

我正在尝试为目录中的所有.msg文件获取messageIds。但是对于某些.msg文件,这些messageId为null。经过一番观察,我意识到这些是回复消息(那些带有“回复”字样的消息作为其文本正文中的第一个字)。对于其他To和From消息,我正确地获取消息ID。为什么会这样?

代码

private String getMsgIds(String srcDir) throws IOException
{
    String cfile; //current files - temporary string to hold file name in for loop
    String msgIds = ""; //message Ids for all messages
    MAPIMessage msg = null; //temporary message variable to hold message while iterating        
    String msgId = "";

    File folder = new File(srcDir);
    File[] listOfFiles = folder.listFiles();


    for (int i = 0; i < listOfFiles.length; i++) 
    {

      if (listOfFiles[i].isFile())  
      {           
          cfile = listOfFiles[i].getName();
          if (cfile.endsWith(".msg") || cfile.endsWith(".MSG"))
          {
              msg = new MAPIMessage(srcDir + "\\" + cfile);
          }
          try
          {
              Chunks chks = msg.getMainChunks();
              StringChunk strMsgId = chks.messageId;

              if(strMsgId != null)
              {
                  msgId = strMsgId.getValue();
                  msgIds += cfile+": "+msgId+"\n";
              }
              else
                  msgIds += cfile+": \n";
          }
          catch(NullPointerException e)
          {
              //ignore
          }

      }
    }

    return msgIds;
}

输出

12.msg: 
Brand ABC.msg: <093F1AED3DF94C4D878DBB625FC76805FFA809@xyz.abc.com>
RE  Test sent mail rule sent on behalf 1.msg: 
RE  Test sent mail rule sent on behalf 2.msg: 
Test mail to check sent rule on Ramprasad 2.msg: <2909CF96D97FDD43BC5EF34B2E2B8A317E5C3A@xyz.abc.com>
Test sent mail rule 1.msg: <B9EF3A9EC5BE2E4297FB08558016D9510F1B2A@xyz.abc.com>
Test sent mail rule 2.msg: <B9EF3A9EC5BE2E4297FB08558016D9510F1B3F@xyz.abc.com>
Test sent mail rule sent on behalf 1.msg:      <B9EF3A9EC5BE2E4297FB08558016D9510F1B51@xyz.abc.com>
Test sent mail rule sent on behalf 2.msg: <B9EF3A9EC5BE2E4297FB08558016D9510F1B6D@xyz.abc.com>
Test wth CC.msg: <EE6C216DE13B484EB4D860361A19C1D7D47905@xyz.abc.com>
test.msg: <EE6C216DE13B484EB4D860361A19C1D7D4780F@xyz.abc.com>

注意上面没有第1,第3和第4条消息的messageId被认可。 我可以知道回复邮件的文件中是否没有MessageIds吗?或者,如果Apache POI无法从回复消息中读取消息ID?

更新

我尝试使用BufferedReader和InputStream来获取原始字符流。在观察字符流时,它显示这些文件没有MessageId而其他文件没有。那可能是什么问题呢?

0 个答案:

没有答案