我将4GB的电子邮件连接到一个文件中,并建议MIME :: Parser可以将各个电子邮件再次分开。我迄今为止的所有尝试最终都是解析器只是复制原始文件而不提取任何电子邮件。那么:这甚至是MIME :: Parser可以处理的东西吗?我的代码非常基础:
my $file = IO::File->new("somefile", O_RDONLY);
my $parser = new MIME::Parser;
$parser->output_dir("somedir");
my $entity = $parser->parse($file);
$file->close;
以下是一些人要求的样本日期的链接。 这是所有垃圾邮件和网上诱骗电子邮件。请勿点击任何链接。享受:Pastbin of 4KB of emails.
答案 0 :(得分:2)
MIME::Parser。它可用于提取附加在另一封邮件中的邮件message/rfc822
,但不是用于从某些邮件中提取邮件一种存档,其中包含大量邮件。
目前尚不清楚您的邮件单个文件的格式。但如果它来自UNIX系统或Thunderbird安装,它可能只是经典的Mbox格式,并且有几种工具可以将Mbox文件拆分成单独的消息。除了several perl modules之外,还有其他工具,例如git-mailsplit
,可以帮助您从Mbox格式中提取邮件。