从RSS Feed获取全文文章

时间:2012-08-13 11:14:29

标签: iphone ios xcode cocoa-touch ipad

您好我正在使用GDataXML来解析RSS源。

但是今天的大多数Feed都没有显示全文文章。所以大多数时候我最终只得到了整件事的一小部分。 我在很多iPhone和iPad阅读器中看到了这个功能 - 它有点从网上获取文章并将其全文放入。

那我该怎么做?

我的想法是这样 - 根元素从文章的开头开始。 所以如果根元素有[文章] 我需要去网站,在起始div之间获取html代码,然后在我的应用程序中显示它。

那么如何获取这些div之间的代码呢?正则表达式还是什么?我想要示例谢谢。

最后,在以html格式获得完整文章后,我如何显示图像?

谢谢大家和问候。

2 个答案:

答案 0 :(得分:0)

使用MWFeedParser,您将获得RSS源

标识符,标题,链接,日期,更新,摘要,内容,附件

答案 1 :(得分:0)

我也使用MWFeedParser,因为它将获取feed条目的所有元素,但你是正确的,它不会“深入”进入feed条目中的所有链接。

如果您想引入链接中的完整内容以及附件中的完整内容(例如播客中的音频或视频),您基本上都在谈论保存网页以供离线观看。对于完整的html页面,您必须保存该HTML,并抓取整个页面并保存图像,并更改这些图像的路径,以便您可以脱机加载它。 RSS应用程序的工作并不是保存HTML内容以供离线使用,而是获取RSS提要的元素。获得要保存以供脱机使用的所有链接后,您需要提供将获取URL并将其保存为脱机的代码。

我搜索了ios save html offline并发现此帖子使用ASIHttpRequest离线保存页面似乎非常积极:https://stackoverflow.com/a/6698854/1072068。一旦你从MWFeedParser获得rss feed条目的部分,我建议你尝试使用类似的东西。