删除办公室标签

时间:2011-07-12 15:38:57

标签: asp.net regex ms-office

我在网站上使用文本编辑器。 (是jHtmlArea) 一些autors是从word文档中复制粘贴文本,最后是令人讨厌的办公室标签,如下所示:

<h2 style="margin: 10pt 0cm 0pt;"><font size="4"><font color="#4f81bd">
<font face="Cambria">Detect if an email is already saved
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
<o:p></o:p></font></font></font></h2>

当用户使用C#代码提交表单时,我想清理此文本。只是更复杂一点我想保留一些标签,因为允许一些html编辑(将其视为白名单):

enter image description here

1 个答案:

答案 0 :(得分:0)

在这里找到正确的解决方案: Stripping all html tags with Html Agility Pack

由于