在python中使用gmail的IMAP4_SSL

时间:2009-06-04 05:49:24

标签: python html gmail

我们正在使用IMAP4_SSL和python从我们的Gmail帐户中检索邮件。 电子邮件正文以html格式检索。 我们需要将其转换为纯文本。 任何人都可以帮助我们吗?

1 个答案:

答案 0 :(得分:2)

站在巨人的肩膀上...... Peter Bengtsson已经找到了解决这个问题的解决方案here 彼得的剧本使用了Leonard Richardson所提供的令人敬畏的BeautifulSoup 和Fredrik Lundh的unescape() function

使用Peter的测试用例,你得到了这个:

This is a paragraph.

Foobar [1]
http://two.com

Visit http://www.google.com.

Text elsewhere. Elsewhere [2]

[1] http://one.com
[2] http://three.com

......来自:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html>
<body>

<div id="main">
<p>This is a paragraph.</p>

<p><a href="http://one.com">Foobar</a>
<br />

<a href="http://two.com">two.com</a>

</p>
  <p>Visit <a href="http://www.google.com">www.google.com</a>.</p>
<br />
Text elsewhere.

<a href="http://three.com">Elsewhere</a>

</div>
</body>
</html>