从没有API的网站检索搜索引擎结果

时间:2015-02-22 15:10:09

标签: php html search-engine

我正在尝试这样的事情:

$url = “http://www.howtogeek.com”;

$str = file_get_contents($url);

显示整个网站。它不是$url中的网站,我试图检索结果的网站没有我可以使用的API。我想得到一些结果标题,等等。有没有简单的方法呢?

1 个答案:

答案 0 :(得分:1)

是的,您需要使用像DomDocument class这样的DOM解析器。用法:

$doc = new DOMDocument();
$doc->loadHTML($html);

然后找到合适的方法来做你想做的事。

您也可以使用preg_match_all()来完成,具体取决于您想要做什么,但can be next to impossible for a full webpage,尤其是您自己无法控制来源。