PHP SimpleHTMLDomParser +找到孤独的字符串

时间:2012-05-10 17:02:05

标签: php html html-parsing simple-html-dom

我正在使用SimpleHTMLDomParser来查看HTML代码并找到各种内容。到目前为止一切正常,但有一个问题:

如何找到没有ID,没有类且没有唯一父元素的字符串?

就我而言,我开始从div中提取内容:

$descrs    = $html->find('.show_synopsis');

foreach($descrs as $descr) { 

    echo($descr->innertext);

}

这看起来像:

<div class="show_synopsis">

    Lorem ipsum dolor sit amet, consetetur sadipscing elitr. <b>Source:</b> LORES.

</div>

现在,是否可以从上面的示例中找到并删除LORES

由于LORES是一个变量且可以更改,我想知道是否可以简单地找到<b>Source:</b>旁边的单词?

我尝试了几种不同的方法,但迄今为止都没有。我试图改编this post的解决方案,但无法根据我的需要调整它们。

2 个答案:

答案 0 :(得分:2)

试试这个:

echo preg_replace('/(.?)<b>.*Source:.*<\/b>.*\./', '$1', $descr->innertext);

答案 1 :(得分:1)

难道你不能只替换你回音的字符串中的LORES吗?

echo str_replace('LORES', '', $descr->innertext);