在http://simplepie.org/demo/上,如果您插入mashable.com,它会自动提取Feed网址。
怎么做?
答案 0 :(得分:5)
您进入页面源并搜索以下元素:
对于RSS Feed:
<link rel="alternate" type="application/rss+xml" href="`your feed address`" />
对于Atom Feed:
<link rel="alternate" type="application/atom+xml" href="`your feed address`" />
这可能是获取源地址的最简单(易于解析)和最可靠(它被明确声明为页面的Feed等效方式)。
答案 1 :(得分:4)
下载源代码并在基目录中打开simplepie.inc
。它包含一个名为SimplePie_Locator
的类,其中包含用于在网站返回的HTML中查找Feeds的方法。
查看方法get_links()
和extension()
它似乎只适用于以html
之一结尾的供稿(link
,area
或('.rss', '.rdf', '.atom', '.xml')
) {1}}
答案 2 :(得分:0)
我相信,它会扫描指定网址上的所有链接(标记)以获取rss格式的响应,这种响应很容易解析并输出为html。
答案 3 :(得分:0)
另一种方法是利用谷歌API来搜索:
filetype:xml site:whatever.com
并返回第一个结果....