如何查找特定网站的RSS源?

时间:2011-06-13 06:06:20

标签: rss

如何查找特定网站的RSS源?是否有任何特定的方法可以找到它?

5 个答案:

答案 0 :(得分:68)

您可以通过查看主页(或博客)的来源找到它。寻找一条如下所示的行:

<link rel="alternate" type="application/rss+xml" title="RSS Feed" href="http://example.org/rss" />

href值将是RSS所在的位置。

答案 1 :(得分:13)

有多种方法可以获取网站的RSS源。

您可以获取网站的网页来源并搜索type="application/rss+xml"

的链接标记

那将包含该网站的RSS源,如果有的话。

这是python中的一个简单程序,它将打印任何网站的RSS提要(如果有的话)。

import requests  
from bs4 import BeautifulSoup  

def get_rss_feed(website_url):
    if website_url is None:
        print("URL should not be null")
    else:
        source_code = requests.get(website_url)
        plain_text = source_code.text
        soup = BeautifulSoup(plain_text)
        for link in soup.find_all("link", {"type" : "application/rss+xml"}):
            href = link.get('href')
            print("RSS feed for " + website_url + "is -->" + str(href))

get_rss_feed("http://www.extremetech.com/")

使用.py扩展名保存此文件并运行它。它将为您提供该网站的RSS订阅源。

Google还提供API来查找网站的RSS源。 请在此处找到它们:Google Feed API

答案 2 :(得分:0)

您需要遍历您网站上的所有网址,然后找到一个包含“rss”的网址。

如果 href 标记中的url看起来像 feed.xml ,上面的方法在某些情况下可能无效,所以在这种情况下你需要循环所有包含 href AND rss 的标签,然后只需从 href 属性解析网址。

如果您想通过浏览器执行此操作,请按CTRL + U查看源,然后按CTRL + F打开查找窗口,然后输入 rss RSS Feed网址应立即显示。

答案 3 :(得分:0)

Firefox的“工具”菜单现在有一个“页面信息”命令。该工具中的一个选项卡显示已发现的Feed信息。

答案 4 :(得分:-3)

我需要找到包含RSS Feed的网站。使用Visual Studio(VB)我能够做到这一点。以下代码只是一个片段。它在循环结束后死亡,但它确实找到了站点上rss页面的任何引用。这就是我所需要的所以我从未完成它。但它对我有用。

导入System.Net Imports System.IO

...         Dim request As WebRequest         request = WebRequest.Create(“http://www.[site]”)

    Dim response As WebResponse = request.GetResponse()
    Dim responseStream As Stream = response.GetResponseStream()
    Dim reader As New StreamReader(responseStream)

    Dim line As String = reader.ReadLine()
    Dim intPos As Integer

    Do
        line = reader.ReadLine()
        intPos = line.IndexOf("/rss")
        If intPos > 0 Then
            MessageBox.Show(line + " " + intPos.ToString)
        End If
    Loop While Not line Is Nothing

...