缓存PHP简单的HTML DOM解析器

时间:2011-05-18 02:26:35

标签: php html parsing caching dom

我使用PHP HTML DOM Parser从外部网站提取数据。为了减少负载并加快页面渲染时间,我想缓存我拉一段时间的数据。我怎么能这样做?

3 个答案:

答案 0 :(得分:7)

我编写了这个文件缓存函数,它基本上只是替换了file_get_contents。您可以在$offset中指定缓存应该持续的时间量,或者使用$override完全覆盖缓存。如果您不想使用/ tmp /,只需将该目录更改为可以读/写的内容。

function cache_get_contents($url, $offset = 600, $override = false) {
    $file = '/tmp/file_cache_' . md5($url);
    if (!$override && file_exists($file) && filemtime($file) > time() - $offset)
        return file_get_contents($file);

    $contents = file_get_contents($url);
    if ($contents === false)
        return false;

    file_put_contents($file, $contents);
    return $contents;
}

答案 1 :(得分:1)

您可以使用HTML创建本地文件,然后跟踪$ SESSION中的文件路径。如果您有磁盘空间并且可以运行数据库,则可以使用数据库执行相同的操作。对您正在寻找的URL的数据库连接和查询不会增加太多开销。

答案 2 :(得分:1)

一种方法是将数据保存到数据库或本地文件中。然后,您可以使用时间戳列或文件修改时间来确定是继续使用缓存还是拉取并保存新副本。

如果您可以访问某种理想的内存缓存(例如memcached)。