修复xhtml中格式错误的标签

时间:2018-09-15 19:34:17

标签: html5 tags repair malformed

我正在构建一个CMS应用程序,该应用程序使用剃刀,Taghelpers和CSS呈现HTML5内容(剧院播放脚本)。剧院剧已经以(格式错误的)xhtml交付给我,并且我尝试了许多正则表达式和HTML-Tiny解决方案来修复格式错误的标签。问题是自定义开始标签是用

而不是适当的结束标签关闭的。内容示例:

... header stuff omitted
<article>
    <section>
        <actor1>Hi Bob. My first speaking line is enclosed in properly formed tag.</actor1>
        <actor2>Hi Ted. That's great but my first speaking line is malformed and needs repair.</p>
        <actor1>Yeah, I have several malfomed lines too.</p>
        <actor3>It sucks 'cause the developer has built a great app to present our play as HTML5 content.</p>
        <actor3>Much of the actors speaking lines are taged with the wrong closing tag and requires repair of hundreds of these files.</p>
        <actor2>and some custom tags are properly formed.</actor2>
    </section>
</article>

事实证明,修复这些自定义标签比第一次尝试要困难得多。 Visual Studio会因错误而嘲笑我:找到了格式错误的“ actor1”标记帮助器。标记助手必须具有开始和结束标记,或者必须是自闭合的。 因此VS可以识别问题,但无法解决。

我尝试了这个https://github.com/gabrieleteotino/TidyHtml5Managed并接近了,但它弄乱了嵌套。 清除内容文件中标签的最简单方法是什么? VS可以自动做到吗?我可以编写一个控制台应用程序...

0 个答案:

没有答案