如何阅读全文RSS Feed

时间:2013-06-02 03:02:34

标签: c# asp.net rss feed

当rss地址没有全文时,某些网站可以获得全文Rss Feed 喜欢这个网站This

我该怎么做?

2 个答案:

答案 0 :(得分:3)

我对C#了解不多,但我仍然可以就如何解决问题给出一般答案。 RSS feed(几乎)总是链接到报纸/博客网站上的文章,整篇文章都可以在这里找到。因此,“RSS填充”从网站内容中获取文章的内容,并基本上将其放回到Feed中,替换可用的(简短)介绍。

要实现这一目标,您需要:

  • 解析/生成RSS / Atoms提要(我确信有很多C#libs可以做到这一点)
  • 从原始RSS Feed中链接的html页面中找到实际文章。事实上,链接页面包含许多你不想放在“完整”RSS提要中的东西(例如网站标题,导航栏,广告,评论,facebook等按钮等)。最简单的方法是使用readability(快速谷歌检查提供this lib)。

如果将这两者结合起来,就可以实现目标。

您可以在http://fivefilters.org找到此类工具的一种实现,其源代码(旧版本)位于/ content-only / http://code.fivefilters.org/full-text-rss/。它是用PHP编写的,但它可以大致了解如何继续。

答案 1 :(得分:0)

您可以从Full post rss feed网站获取扩展部分RSS Feed的完整脚本 这些步骤包括:   - 从RSS源获取帖子URL   - 获取帖子URL的完整内容,它将使用curl获取内容   - 解析内容,它使用模板。他们不断更新最受欢迎的网站和wordpress主题的模板。基于该模板,将html内容解析为html dom对象,然后根据html dom对象查找内容。
- 最后,使用完整内容再次生成rss feed。

您可以查看用PHP编写的脚本以获得一些想法,稍后您可以将逻辑重写为任何语言。