我有一个小应用程序来处理从带有fetchmail的imap服务器下载的电子邮件。处理包括查找带有XML文件的base64编码附件。
这是代码(有点剥离):
def extract_data_from_mailfile(mailfile)
begin
mail = TMail::Mail.load(mailfile)
rescue
return nil
end
bodies_found = []
if mail.multipart? then
mail.parts.each do |m|
bodies_found << m.body
end
end
## Let's parse the parts we found in the mail to see if one of them
## looks XML-ish. Hacky but works for now.
## was XML.
bodies_found.each do |body|
if body =~ /^<\?XML /i then
return body
end
end
return nil # Nothing found.
end
这很好用,但是在大型XML文件(通常是> 600k邮件文件)上,这会中断。
>> mail.parts[1].body.size
=> 487424 <-- should have been larger - doesn't include the end of the file
Base64解码也不会自动发生。但这是我尝试手动运行解码的时候:
>> Base64::decode64(mail.parts[1].body)
[...] ll="SMTP"></Sendt><Sendt"
这是XML文件的一部分,但它已被剪裁。
任何获得整个附件的方法?任何提示?
答案 0 :(得分:0)
我看到你的代码突破了第一个找到的XML片段的循环。也许较大的消息将XML分成相同的多部分MIME消息中的较小块?然后,您将返回一个数组的实体并将它们连接起来
mail.parts[1].body[0] + mail.parts[1].body[1]
(PS。这是一个很长的镜头,我没试过这个)