在PHP中解析无效HTML的最佳方法

时间:2010-08-31 07:15:15

标签: php html parsing

有没有更好的方法来解析无效的HTML然后在其上应用Tidy?

旁注: 有些情况下你不能提供Tidy。 我还不建议使用Regexp解析html。

2 个答案:

答案 0 :(得分:6)

我会尝试这样的事情:http://php.net/manual/en/domdocument.loadhtml.php

从该页面开始:

  

该函数解析字符串源中包含的HTML。与加载XML不同, HTML不一定要加载。也可以静态调用此函数来加载和创建DOMDocument对象。

答案 1 :(得分:1)

众所周知,

SimpleHTMLDOM比PHP的本机DOM函数更宽松。