Question

我想在我的网络应用程序上构建一个教育搜索引擎，所以我决定从我的网页上使用PHP抓取大约10个网站，并将数据存储到我的数据库中供以后搜索。如何检索此数据并将其存储在我的数据库中？

Answer 1

您可以使用file_get_contents()功能获取它们。所以你有

$homepage = file_get_contents('http://www.example.com/homepage');

此函数将页面返回到字符串中。

希望这会有所帮助。干杯

Answer 2

构建一个抓取工具我会列出要获取的URL列表并最终获取它们

：一种。列表

为此你可以使用这个类，这使得解析html非常简单： http://simplehtmldom.sourceforge.net/

<强> B中。获取内容

在阵列上循环并获取内容。 file_get_contents将为您执行此操作： http://www.php.net/manual/fr/function.file-get-contents.php

这对于一个开始基本上是有效的，在步骤A中，你应该保留一个已经解析过的URL列表，只检查一个。查询字符串也可以是您所关注的内容，以避免使用不同的查询字符串扫描多个页面。