使用PHP Dom解析格式错误的HTML

时间:2010-03-04 22:53:40

标签: php html-parsing domdocument

我的客户想要在他们的网站上显示他们的视频(由第三方提供)。该网站使用swfobject来显示视频,所以我认为最简单的方法是抓住它并稍加修改,以便它可以在客户的网站上运行。

使用PHP DOMDocument似乎是可行的方法,但不幸的是,提供的HTML格式不正确并导致心脏病发作。是否可以让它忽略HTML中的错误,或者我可以做的另一种方式?

2 个答案:

答案 0 :(得分:3)

这是PHP Tidy的用途。对于example

<?php
ob_start();
?>
<html>a html document</html>
<?php
$html = ob_get_clean();

// Specify configuration
$config = array(
           'indent'         => true,
           'output-xhtml'   => true,
           'wrap'           => 200);

// Tidy
$tidy = new tidy;
$tidy->parseString($html, $config, 'utf8');
$tidy->cleanRepair();

// Output
echo $tidy;
?>

请参阅HTML Tidy Configuration Options

答案 1 :(得分:0)

如果您喜欢jQuery,可以使用“Simple HTML Dom Parser”。它很棒。