我需要能够"消毒"编辑器的HTML输出。 当粘贴来自电子邮件的内容时,它会带来各种奇怪和精彩的标记。
例如:
<p class="MsoNormal">Please can you Exclude <b>blah</b> products from the free delivery rule, we would like delivery to be £20.00 ex VAT for these products.<o:p></o:p></p>
以上HTML似乎有效,但电子邮件的其余部分却没有。 我需要能够保留格式,因此不能简单地转义所有html实体。
我遇到的问题主要是在显示内容时。 如果我要在编辑器中编辑源代码(我最终会禁用此功能,它比复制和粘贴电子邮件更容易),输入以下代码:
<p class="
它会将我插入的页面呈现为无效。
我想删除无效标记,例如上面的标记,但保留有效标记。 例如,这个:
<p class="
<b>some bold text</b>
</p>
成为这个:
<b>some bold text</b>
实际纠正无效的HTML可能会更好,但这可能更难实现。
我考虑过找一个使用短代码的编辑器,例如Stack Overflow,但这不允许我复制和粘贴格式化的电子邮件。