simple_html_dom明文结果没有空格

时间:2014-09-03 07:38:04

标签: php html-parsing simple-html-dom

我有以下html:

<div><p>Launched:</p> <p>2010</p><p>Categories:</p><p>Software</p><p>Description:</p><p>Established</p><p>Website:</p></div>

如果我加载它并使用明文来获取文本:

$str = '<div><p>Launched:</p><p>2010</p><p>Categories:</p><p>Software</p><p>Description:</p><p>Established</p><p>Website:</p></div>'; $html = str_get_html($str); echo $html->plaintext;

结果是不同的p标签之间没有空格:

发射:2010Categories:SoftwareDescription:EstablishedWebsite:

如果我在结束和打开p标签之间添加一个空格,它会正确输出。

这是一种正确的行为吗?

有没有办法让解析器在明文输出中考虑p标签?

2 个答案:

答案 0 :(得分:0)

您必须在标签p之间留出空格,或者您可以这样做:

$result = "";
foreach($html->find('p') as $val){
    $result .= $val->plaintext." " ;
}

答案 1 :(得分:-1)

你可以用这种方式剥离标签

    $content = file_get_contents($url);
    $rawContent = strip_tags($content);
    $html = str_get_html($content);