Question

在http://simplepie.org/demo/上，如果您插入mashable.com，它会自动提取Feed网址。

怎么做？

Answer 1

您进入页面源并搜索以下元素：

对于RSS Feed：

<link rel="alternate" type="application/rss+xml" href="`your feed address`" />

对于Atom Feed：

<link rel="alternate" type="application/atom+xml" href="`your feed address`" />

这可能是获取源地址的最简单（易于解析）和最可靠（它被明确声明为页面的Feed等效方式）。

Answer 2

下载源代码并在基目录中打开simplepie.inc。它包含一个名为SimplePie_Locator的类，其中包含用于在网站返回的HTML中查找Feeds的方法。

查看方法get_links()和extension()它似乎只适用于以html之一结尾的供稿（link，area或('.rss', '.rdf', '.atom', '.xml')） {1}}

Answer 3

我相信，它会扫描指定网址上的所有链接（标记）以获取rss格式的响应，这种响应很容易解析并输出为html。

Answer 4

另一种方法是利用谷歌API来搜索：

filetype:xml site:whatever.com

并返回第一个结果....