当rss地址没有全文时,某些网站可以获得全文Rss Feed 喜欢这个网站This
我该怎么做?
答案 0 :(得分:3)
我对C#了解不多,但我仍然可以就如何解决问题给出一般答案。 RSS feed(几乎)总是链接到报纸/博客网站上的文章,整篇文章都可以在这里找到。因此,“RSS填充”从网站内容中获取文章的内容,并基本上将其放回到Feed中,替换可用的(简短)介绍。
要实现这一目标,您需要:
readability
(快速谷歌检查提供this lib)。如果将这两者结合起来,就可以实现目标。
您可以在http://fivefilters.org找到此类工具的一种实现,其源代码(旧版本)位于/ content-only / http://code.fivefilters.org/full-text-rss/。它是用PHP编写的,但它可以大致了解如何继续。
答案 1 :(得分:0)
您可以从Full post rss feed网站获取扩展部分RSS Feed的完整脚本
这些步骤包括:
- 从RSS源获取帖子URL
- 获取帖子URL的完整内容,它将使用curl获取内容
- 解析内容,它使用模板。他们不断更新最受欢迎的网站和wordpress主题的模板。基于该模板,将html内容解析为html dom对象,然后根据html dom对象查找内容。
- 最后,使用完整内容再次生成rss feed。
您可以查看用PHP编写的脚本以获得一些想法,稍后您可以将逻辑重写为任何语言。