下午好,我正在研究Python中的一种垃圾邮件过滤器,并且我已从该语料库中下载了一些垃圾邮件并损坏了电子邮件
https://spamassassin.apache.org/publiccorpus/
这是我为阅读mbox文件而编写的代码
import os
import mailbox
import sys
import pprint
print("Reading emails:")
for mbox_file in os.listdir(os.getcwd()+"/spam"):
print("Processing "+mbox_file)
mbox = mailbox.mbox(mbox_file)
for message in mbox:
print(message['from'])
事情是,它显然无法识别文件,因为它根本不会读取任何内容。我创建了一个单独的.mbox文件,复制其中一个文件的内容,并且它完美地呈现。我也尝试使用read()读取文件,并抛出错误消息,指出该文件不存在。我不知道我错过了什么,任何帮助都会很好。谢谢你的时间