我有一个邮件内容,可能包含html / css。我想从标签,图像中清除文本,但希望保留格式,因此它仍然足够可读。
架构是:
1)从服务器获取电子邮件;
2)将其存储在数据库中;
3)通过Spring后端请求访问网页
4)显示它从html / css标签清理,只是纯文本,它将包含新行,空格,一些基本格式。
这段代码可以帮助我摆脱html标签,但所有文字都变得可读。
var htmlToPlaintext = function(text) {
return text ? String(text).replace(/<[^>]+>/gm, '') : '';
};
&#13;
有关如何达到预期效果的任何建议?
P.S。:如果需要,我可以在java后端预处理数据。
谢谢!
答案 0 :(得分:0)
我认为您应该让浏览器为您执行此操作。
检查此getText
功能:
function getText(html)
{
var tmp = document.createElement("div");
tmp.innerHTML = html;
return tmp.textContent||tmp.innerText;
}
var html = document.getElementById("htmlDiv").innerHTML;
alert(getText(html))
&#13;
<div id='htmlDiv'>
<div>this is first line. <span> another part</span></div>
<div>this is another line.
<p>
paragraph 1
</p>
<p>
paragraph 2
</p>
</div>
</div>
&#13;