所以,说我是一名记者,他希望通过某种方式轻松发布我撰写的故事链接,这些故事发布在我的报纸网站上。唉,我的报纸的网站不提供用户级的RSS提要(用户级别的任何记者,真的)。
运行搜索(即http://www.calgaryherald.com/search/search.html?q=Rininsland)会以反向的时间顺序显示我所做的一切(尽管有一些重复;暂时忽略,稍后会处理)。 有什么办法可以将其解析为RSS Feed吗?
好像是雅虎!管道可能是一种简单的方法,但我对任何事情都持开放态度。
谢谢!
答案 0 :(得分:1)
通常情况下,这将是雅虎管道的一个很好的用途,但看起来您引用的搜索页面有一个robots.txt文件,Pipes尊重它。这意味着Pipes不会从页面中提取数据。
有关详细信息:“如何让Pipes无法访问我的网页?” http://pipes.yahoo.com/pipes/docs?doc=troubleshooting#q14
您必须自己编写一个刮刀,向该URL发出HTTP请求,解析响应,并将RSS写为输出。这可以在许多服务器端环境中完成,例如PHP,Python等。
编辑:Feedity提供将网页抓取到Feed中的服务。这是您搜索网址的Feedity Feed: http://feedity.com/rss.aspx/calgaryherald-com/UFJWUVZQ
但是,除非您注册订阅($ 3.25 /月),否则此Feed将受到以下限制:
创建免费Feed 没有帐户限制为5 项目和10小时更新间隔。 无帐户创建的免费Feed 被自动清除 系统闲置30天后。
答案 1 :(得分:0)
如果它只是每篇文章的链接和时间戳,那么Yahoo Pipes 搜索模块将返回Herlad网站的最新10个搜索索引。