我想从网站的源代码中获取一些数据并编辑该源,然后将其添加到数据库中。我知道php的file_get_contents
函数,但我不知道如何使用这种方法获取数据。
原始来源:
<div id="wwww" class="ssss">
<div id="1" class="2"><p>my data : </p><div id="a" class="b">i want this data</div>
<div class="action">delete</div></div>
</div>
获取标识为1
的div源并删除类action
的div源,最后打印数据如下:
<div id="1" class="2"><p>my data :</p><div id="a" class="b">i want this data</div></div>
请介绍一下可以使用的方法的php函数。
答案 0 :(得分:0)
看看PHP Simple HTML DOM Parser。它非常易于使用:
$html = file_get_html('http://www.google.com/');
$myDiv = $html->find('div[id=1]');