(重新)格式化来自多个源/文本编辑器的HTML

时间:2014-05-13 11:35:11

标签: html asp-classic

我正在招聘一个接受许多其他服务的API帖子的工作板。我们一直遇到收到的html问题,例如<div>标签未关闭,内联CSS样式正在使用等。

我们收到的每项服务都有自己的规则和怪癖。这个问题更加复杂,因为最终用户正在从Word文件复制/粘贴到他们的所见即所得编辑器中,然后他们才会被发送给我们!

似乎唯一可靠的解决方案是删除所有的html。但这会让用户感到恼火,因为他们所有的子弹,粗体文字和标题都缺失了。

我尝试使用用换行符等替换<p>标签的公式,但我从未设法使其工作得令人满意。

有人可以建议一种对他们有用的方法或解决方案吗?

我专门研究修复坏标记的方法,而不是强制执行好的标记。这是因为在很多情况下,最终用户遇到了一个糟糕的系统,大多数人都没有理解或修复坏的HTML的知识。

(我们正在使用经典ASP并且正在迁移到MVC。)

2 个答案:

答案 0 :(得分:1)

可能你可以通过实现浏览器怪癖模式来部分解决这个问题。如果客户端向您发送足够好的标记,则将其发布为&#34; rich&#34;标记并回复&#34;成功&#34;。如果客户端发送的东西太乱了 - 将其作为条带版本发布并使用标记错误列表进行响应。如果他想要酷和富裕的#34;标记他应该修复它。

答案 1 :(得分:1)

在您的结尾显示您的客户在iframe中的回复。

由于Iframe不会干扰您的设计布局 - 客户会看到他们发送给您的内容(并修复他们的错误或得到他们应得的),您的网页看起来会完整无缺。