在markdown文件中查找无效的HTML

时间:2014-07-26 08:23:21

标签: html markdown jekyll kramdown

我使用了一些疯狂的外星技术*将我的HTML内容转换为Jekyll的降价。

我注意到有些文件的HTML无效。有大量文件,所以没有人可以快速手动审查所有文件。

有没有办法可以快速列出所有无效HTML的文件而忽略降价内容?可能使用Windows应用程序?

*应用

2 个答案:

答案 0 :(得分:1)

您应该尝试HTML Tidy,在解析之前使用tidy进行清理。

答案 1 :(得分:0)

例如,

Pandoc似乎传递了markdown输入中包含的无效html。将Pandoc的HTML输出传递给HTML Tidy进行验证。类似的东西:

$ pandoc input.md | tidy