快速问题,我有一个正在运行的进程,它抓取RSS提要并将它们添加到mySQL数据库。
在此过程中,我将使用Readability API随时获取网址内容。
现在这适用于单个条目,但由于此脚本可能有数百个条目,因此没有任何内容插入到我的数据库中。
我想知道它是否没有机会完成这个过程并立即跳到RSS的下一个条目。
任何人都可以建议一种让它在完成之前完成的方法吗?代码如下:
$db_hostname="localhost";
$db_username="myusername";
$db_password="mypassword";
try
{
/* query the database */
$db = mysql_connect($db_hostname,$db_username,$db_password);
if (!$db)
{
die("Could not connect: " . mysql_error());
}
mysql_select_db("MyDB", $db);
// Get stories that don't have a the readability assigned
$query="select item_id, item_url from tw_articles_parse where story_readability = '' LIMIT 0 , 1";
$result=mysql_query($query);
$num=mysql_numrows($result);
// Close the DB connection
mysql_close();
// Start the loop of source RSS feeds
$i=0;
while ($i < $num) {
$item_url=mysql_result($result,$i,"item_url");
$item_id=mysql_result($result,$i,"item_id");
// Parse the story URL into the Readability API
$url = "https://www.readability.com/api/content/v1/parser?url=$item_url&token=myapikey";
// Get the contents of the JSON returned by the API
$json = file_get_contents($url);
// Decode the JSON
$out = json_decode($json, true);
// Set the content as a variable
$story = mysql_real_escape_string($out['content']);
// Insert into the DB - Adding 0 to story_club_id as default
$item_insert_sql = "UPDATE tw_articles_parse SET story_readability=$story WHERE item_id='" . $item_id . "'";
$insert_item = mysql_query($item_insert_sql, $db);
$i++;
}// end the loop of feeds
} catch (Exception $e)
{
echo 'Caught exception: ', $e->getMessage(), "\n";
}
答案 0 :(得分:0)
也许你的内存或时间不足?启用警告和错误报告:
ini_set("display_errors", 1);
error_reporting(E_ALL);
答案 1 :(得分:0)
可能没有插入任何内容,因为您正在使用UPDATE语句,并且根本没有要更新correspoding item_id的此类记录? 尝试将UPDATE查询更改为INSERT ... ON DUPLICATE KEY UPDATE
不幸的是我们不知道您的数据库方案,但这样的事情应该有效:
$item_insert_sql = "INSERT INTO tw_articles_parse (story_readability, item_id) VALUES ('$story', $item_id) ON DUPLICATE KEY UPDATE story_readability='$story'";