有没有更好的方法来解析无效的HTML然后在其上应用Tidy?
旁注: 有些情况下你不能提供Tidy。 我还不建议使用Regexp解析html。
答案 0 :(得分:6)
我会尝试这样的事情:http://php.net/manual/en/domdocument.loadhtml.php
从该页面开始:
该函数解析字符串源中包含的HTML。与加载XML不同, HTML不一定要加载。也可以静态调用此函数来加载和创建DOMDocument对象。
答案 1 :(得分:1)
SimpleHTMLDOM比PHP的本机DOM函数更宽松。