所以我使用简单的html dom解析器从另一方获得内容。网站结构如下所示:
<div class="content">
<p> Text i dont need </p>
<a href="#top">Anchor I dont need</a>
<h3>Heading I need</h3>
<p>Text I need</p>
</div>
所以你看到他们没有类,h3和p里面的文本长度和内容都是可变的,而且h3的位置可以在不同的站点之间变化,因为有时在h3之前有更多的p标签。 我怎么能这样做?
网站:http://www.auswaertiges-amt.de/DE/Laenderinformationen/00-SiHi/BolivienSicherheit.html
答案 0 :(得分:0)
您可以使用DomManipulating PHP类,例如:http://simplehtmldom.sourceforge.net/ 然后你可以使用:
$html->find('div', 1)->class = 'bar';
或者你可以简单地使用Jquery来添加你的类/属性。
$('.content').find('p').addClass('bar');