BlackBerry 10设备仅发送HTML电子邮件。
虽然这对于丢弃遗留内容(单独的参数)的运动来说“很棒”,但是当你需要纯文本时这很烦人。它只是不可用。
如何从BB10设备发送的电子邮件中获取纯文本?
答案 0 :(得分:1)
使用python和xpath,从HTML中提取文本:
#!/usr/bin/python3
import urllib.request
import quopri
import lxml.html
# actual test fragments are here
raw_url = 'https://gist.github.com/Supermathie/7866658/raw/80e4abd4226b916a54b224677af7fda881d0937f/sample+1'
raw_url_no_sig = 'https://gist.github.com/Supermathie/7866658/raw/df354d6b8f3176c3d8bdb89b2961bb0ccc78520c/sample+2'
def get_divs(url):
email_body_raw = urllib.request.urlopen(url).read()
email_body = quopri.decodestring(email_body_raw)
email_xml = lxml.html.document_fromstring(email_body)
email_divs = email_xml.xpath('//div[@id="_signaturePlaceholder"]/preceding-sibling::div')
return email_divs
print('\n'.join([str(node.text_content() or "") for node in get_divs(raw_url)]))
print('\n'.join([str(node.text_content() or "") for node in get_divs(raw_url_no_sig)]))
对于两个测试用例,打印:
让我们记住,文章中的信息是通过不少于两个不完全讲技术的人过滤的。我想我可以把它翻译回来:
«FBI制作了一个针对Mo的定制恶意软件,旨在窥探他的活动。在鱼叉式网络钓鱼攻击中通过电子邮件向Mo发送了一个链接,试图从FBI的受监控服务器下载并安装恶意软件。
尝试失败;该软件已下载但从未以允许软件向FBI发回信息的方式执行。»
没什么特别的。我想知道莫是否有球将软件提交给Sophos等进行恶意软件分析。 :)
微米。
和
测试电子邮件
无签名