从无RSS搜索结果创建聚合RSS源

时间:2011-06-06 17:36:30

标签: rss yahoo-pipes

所以,说我是一名记者,他希望通过某种方式轻松发布我撰写的故事链接,这些故事发布在我的报纸网站上。唉,我的报纸的网站不提供用户级的RSS提要(用户级别的任何记者,真的)。

运行搜索(即http://www.calgaryherald.com/search/search.html?q=Rininsland)会以反向的时间顺序显示我所做的一切(尽管有一些重复;暂时忽略,稍后会处理)。 有什么办法可以将其解析为RSS Feed吗?

好像是雅虎!管道可能是一种简单的方法,但我对任何事情都持开放态度。

谢谢!

2 个答案:

答案 0 :(得分:1)

通常情况下,这将是雅虎管道的一个很好的用途,但看起来您引用的搜索页面有一个robots.txt文件,Pipes尊重它。这意味着Pipes不会从页面中提取数据。

有关详细信息:“如何让Pipes无法访问我的网页?” http://pipes.yahoo.com/pipes/docs?doc=troubleshooting#q14

您必须自己编写一个刮刀,向该URL发出HTTP请求,解析响应,并将RSS写为输出。这可以在许多服务器端环境中完成,例如PHP,Python等。


编辑:Feedity提供将网页抓取到Feed中的服务。这是您搜索网址的Feedity Feed: http://feedity.com/rss.aspx/calgaryherald-com/UFJWUVZQ

但是,除非您注册订阅($ 3.25 /月),否则此Feed将受到以下限制:

  

创建免费Feed   没有帐户限制为5   项目和10小时更新间隔。   无帐户创建的免费Feed   被自动清除   系统闲置30天后。

答案 1 :(得分:0)

如果它只是每篇文章的链接和时间戳,那么Yahoo Pipes 搜索模块将返回Herlad网站的最新10个搜索索引。