如何在不花费太多时间的情况下比较发布日期?

时间:2018-06-25 23:12:30

标签: php regex curl web-scraping rss

我正在建立一个网站,该网站将显示新闻网站的最新帖子,数量将超过5。

我可以使用RSS和CURL或类似方法获取帖子和帖子日期。

我也可以使用库或纯PHP刮取这些数据。

但是问题在于,要花大约7页的时间,假设每个页面有10个帖子,所以将有70个帖子。

然后,我将在它们之间进行比较,以获取最新的50,例如,大多数可能来自一个站点,这取决于日期。

所以我想知道该怎么做?我应该使用CURL吗?还是纯PHP和一些Regx?我应该使用PHP库吗?

例如,如果我创建一个数据库,然后每小时运行一个cron作业,并仅保存最新的50个,然后显示数据库的结果,那会更好吗?

1 个答案:

答案 0 :(得分:0)

最好使用curl_multi_ *而不是纯PHP,因为您将拥有更多控制权,并且对并行操作没有PHP限制。您当然可以运行cronjob并将数据存储在数据库中。