我的网站daisy.camorada.com运行速度很慢。它运行缓慢的原因是我正在提取多个RSS源以创建页面上显示的每个砖石。
我的问题基本上是,我应该如何构建我的网站以使其快速,高效和可扩展?
我考虑过使用Code Igniter将RSS提要放入数据库,然后在刷新页面时随时从该数据库中提取。我该怎么做?
以下是我想到的结构图:
以下是提取Feed的当前PHP代码(我知道它非常混乱,抱歉): https://gist.github.com/3506863
答案 0 :(得分:3)
使用CodeIgniter的道具,我讨厌人们在没有框架的情况下从头开始构建,以减轻样板代码。
查看设置 CRONJOB 或 Windows任务计划程序,并拥有一个处理RSS源(以及某种形式的缓存)的CONTROLLER。
您可以使用内置的 CI缓存进行SIMPLY缓存,也可以按照您的描述执行操作,方法是将文本存储在数据库中。
如何通过CLI运行您的cronjob:http://codeigniter.com/user_guide/general/cli.html
或者您可以只查找现有的CI库来为您执行缓存/提取: http://codeigniter.com/forums/viewthread/160394/
答案 1 :(得分:2)
根据我在runninng RSS大规模聚合器方面的经验。
我强烈建议您使用SimplePie。它使您的工作变得更加容易。 它内置了缓存机制,因此您可以在主页上提供缓存,同时在数据库中存储所需的内容。
SimplePie还内置like-wordpress functions,,可获取标题,内容,时间戳等。它还允许您将多个RSS源混合为一个。
很抱歉,答案最后是关于simplepie,但这是我在运行这些网站时做出的最佳选择之一。
答案 2 :(得分:2)
以下是如何将您的Feed缓存到您的文件系统上,无需数据库,并从那里拉一段时间,这将大大加快您的应用程序。也许它有一些兴趣。
<?php
//Have a list of feeds
$feeds = array(
'http://rss.cnn.com/rss/cnn_topstories.rss',
'http://api.twitter.com/1/statuses/user_timeline.rss?screen_name=breakingnews',
'http://www.nytimes.com/services/xml/rss/nyt/pop_top.xml',
'http://news.yahoo.com/rss',
);
$cache_for = 3600; //in seconds
$feed_results = array();
/**
* Loop through each feed and check if its age is older then $cache_for
* Grab the feed and store in ./feeds_data
* On next refresh feed is pulled from cache until $cache_for expires
*/
foreach($feeds as $feed){
if(cache(sha1($feed), 'check', null, './feeds_data', $cache_for) == false){
$result = curl_get($feed);
$feed_result[$feed] = cache(sha1($feed), 'put', $result, './feeds_data', $cache_for);
}else{
$feed_result[$feed] = cache(sha1($feed), 'get', null, './feeds_data', $cache_for);
}
}
//Loop through each feed result and render
foreach($feed_result as $result){
render_feed_newz_caption($result);
}
//The curl function, curl is considerably faster then fopen that simplexml_load_file uses
function curl_get($url){
if (!function_exists('curl_init')){
die('Sorry cURL is not installed!');
}
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0 Firefox/5.0');
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);
curl_setopt($ch, CURLOPT_ENCODING,'gzip,deflate');
curl_setopt($ch, CURLOPT_AUTOREFERER,true);
$output = curl_exec($ch);
curl_close($ch);
return $output;
}
function cache($key, $do, $result=null, $storepath, $cacheTime=86400){
switch($do){
case "check":
if(file_exists($storepath.'/'.sha1($key).'.php')){
if((time() - $cacheTime < filemtime($storepath.'/'.sha1($key).'.php'))){
return true;
}
return false;
}else{
return false;
}
break;
case "put":
//Compress
$compressed = gzdeflate($result, 9);
$compressed = gzdeflate($compressed, 9);
file_put_contents($storepath.'/'.sha1($key).'.php', base64_encode($compressed));
return $result;
break;
case "get":
$cache = base64_decode(file_get_contents($storepath.'/'.sha1($key).".php"));
//De-compress
$compressed = gzinflate($cache);
$compressed = gzinflate($compressed);
return $compressed;
break;
default:
return false;
break;
}
}
//Function to wrap your parse
function render_feed_newz_caption($feed){
//load XML string!
$xml = simplexml_load_string($feed);
libxml_use_internal_errors(true);
if(isset($xml->channel->item))
foreach($xml->channel->item as $YODEL){
$title = $YODEL->title;
$description = $YODEL->description;
$link = $YODEL->link;
$pubDate = $YODEL->pubDate; //should be able to use Rutgers pubDate to sort newest.... get a better Drudge feed to do the same
$image = $YODEL->image;
//echo"<div class ='masonry_item' style='background: #FFFFFF;'><a href='". $link ."'>" . "RUT: " . $pubDate . "<br />" . $title . "</a> <!--" . $description . "--></div> <br>";
echo "
<div class='box'>
<div class ='newz_caption' style='background: #FFFFFF;'>
<h3>" . $title . "</h3>
<h5>CNN: " . $pubDate . "</h5>
<p> " . $description . " </p>
<p>
<a class='btn btn-primary' href='" . $link . "'> Source </a>
<a class='btn' href='#'>Thumbs Up </a>
</p>
</div>
</div>
<br>";
}
}
?>