使用mbox Python模块读取mbox文件

时间:2017-03-05 21:21:56

标签: python mbox

下午好,我正在研究Python中的一种垃圾邮件过滤器,并且我已从该语料库中下载了一些垃圾邮件并损坏了电子邮件

https://spamassassin.apache.org/publiccorpus/

这是我为阅读mbox文件而编写的代码

import os
import mailbox
import sys
import pprint

print("Reading emails:")

for mbox_file in os.listdir(os.getcwd()+"/spam"):

    print("Processing "+mbox_file)
    mbox = mailbox.mbox(mbox_file)

    for message in mbox:
        print(message['from'])

事情是,它显然无法识别文件,因为它根本不会读取任何内容。我创建了一个单独的.mbox文件,复制其中一个文件的内容,并且它完美地呈现。我也尝试使用read()读取文件,并抛出错误消息,指出该文件不存在。我不知道我错过了什么,任何帮助都会很好。谢谢你的时间

0 个答案:

没有答案