我正在使用SimpleHTMLDomParser来查看HTML代码并找到各种内容。到目前为止一切正常,但有一个问题:
如何找到没有ID,没有类且没有唯一父元素的字符串?
就我而言,我开始从div中提取内容:
$descrs = $html->find('.show_synopsis');
foreach($descrs as $descr) {
echo($descr->innertext);
}
这看起来像:
<div class="show_synopsis">
Lorem ipsum dolor sit amet, consetetur sadipscing elitr. <b>Source:</b> LORES.
</div>
现在,是否可以从上面的示例中找到并删除LORES
?
由于LORES
是一个变量且可以更改,我想知道是否可以简单地找到<b>Source:</b>
旁边的单词?
我尝试了几种不同的方法,但迄今为止都没有。我试图改编this post的解决方案,但无法根据我的需要调整它们。
答案 0 :(得分:2)
试试这个:
echo preg_replace('/(.?)<b>.*Source:.*<\/b>.*\./', '$1', $descr->innertext);
答案 1 :(得分:1)
难道你不能只替换你回音的字符串中的LORES吗?
echo str_replace('LORES', '', $descr->innertext);