从html剥离邮件正文,格式保留Javascript

时间:2016-01-19 16:11:38

标签: javascript java jquery html css

我有一个邮件内容,可能包含html / css。我想从标签,图像中清除文本,但希望保留格式,因此它仍然足够可读。

架构是:

1)从服务器获取电子邮件;

2)将其存储在数据库中;

3)通过Spring后端请求访问网页

4)显示它从html / css标签清理,只是纯文本,它将包含新行,空格,一些基本格式。

这段代码可以帮助我摆脱html标签,但所有文字都变得可读。



var htmlToPlaintext = function(text) {
            return text ? String(text).replace(/<[^>]+>/gm, '') : '';
};
&#13;
&#13;
&#13;

有关如何达到预期效果的任何建议?

P.S。:如果需要,我可以在java后端预处理数据。

谢谢!

1 个答案:

答案 0 :(得分:0)

我认为您应该让浏览器为您执行此操作。

检查此getText功能:

&#13;
&#13;
function getText(html)
{
   var tmp = document.createElement("div");
   tmp.innerHTML = html;
   return tmp.textContent||tmp.innerText;
}
var html = document.getElementById("htmlDiv").innerHTML;
alert(getText(html))
&#13;
<div id='htmlDiv'>
  <div>this is first line. <span> another part</span></div>
  <div>this is another line. 
    <p>
      paragraph 1
    </p>
    <p> 
      paragraph 2
    </p>
  </div>
</div>
&#13;
&#13;
&#13;