自上次下载以来,上次修改以检查订阅源已更新

时间:2013-11-10 08:53:41

标签: php feed rss-reader news-feed feedparser

我使用PHP每半小时读取一次feed xml,截至目前我总是阅读整个feed文件是否更新。但是我想检查自上次下载后feed xml是否更新,如果更新则只读取xml,否则不会。

我正在尝试使用以下代码实现它,但$ lastmodifiedRSS始终为空。我不确定我的代码出了什么问题。如果我得到$ lastmodifiedRSS,那么我可以轻松地将它与上次加载的时间进行比较,然后决定做什么。

如果有任何专家可以分享一些很棒的信息。提前谢谢。

//get feed information & content
$feed = new feed($rssurl);
$feed->load();

//get the last modified date (web server information)
$lastmodifiedRSS = $feed->http->get_header_value('Last-Modified');

        function http($url)
{
    $this->url($url);
    $this->user_agent = 'posh';
    $this->header = "";
    $this->code = "";
    $this->codeStr = "";
    $this->max_d = 5;
    $this->authorization = "";
    $this->proxy_auth = "";
    $this->url = $url;
    $this->addProxy();
}

    function feed($url)
{
    if ($url) {
        $this->url = $url;
        $this->http = new http($url);
        //$this->addProxy();
    } else {
        $this->http = new http('');      
    }
}
function load()
    {
        $content= $this->http->get();
        if (!$content)
            return false;
        $content = $this->transcode($content);
        return $content;
    }

function get_header_value($name)
    {
        if (preg_match("/$name: ?([^\\r\\n]*)\\r\\n/m",$this->head,$matches) !== false)
        {
            if (count($matches) > 1)
            {
                return $matches[1];
            }
        }
        return false;
    }

此致 莫纳

2 个答案:

答案 0 :(得分:1)

在PHP中使用 stat()

<?php
print_r(stat('users.json'));

<强>输出:

Array ( [0] => 2 [1] => 0 [2] => 33206 [3] => 1 [4] => 0 [5] => 0 [6] => 2 [7] => 298 [8] => 1384073940 [9] => 1384073940 [10] => 1368626190 [11] => -1 [12] => -1 [dev] => 2 [ino] => 0 [mode] => 33206 [nlink] => 1 [uid] => 0 [gid] => 0 [rdev] => 2 [size] => 298 [atime] => 1384073940 [mtime] => 1384073940 [ctime] => 1368626190 [blksize] => -1 [blocks] => -1 )

Source

跟踪变量[atime],[size]可以帮助您实现您想要做的事情。

答案 1 :(得分:0)

使用HTTP标头本身可以更好地处理这种检查。

如果服务器在响应中发送Etag标头,您可以在下一个请求中使用If-None-Match标头来知道文件是否已更改。

同样,如果服务器在响应中发送Last-Modified标头,您可以在下一个请求中使用此时间戳和If-Modified-Since标头来了解文件是否已更改。

只是为了让您知道您可以做什么,我无法提供任何代码,因为我不知道您在这里使用的是哪个HTTP库。