Question

我尝试使用php和几个不同的rss / atom阅读器解析自然杂志的feed，但我找不到合适的阅读方法。

他们的饲料结构对我来说很不可思议，但肯定不是RSS，但在原子阅读器的帮助下，我也无法得到任何正确的答案。

示例：http://feeds.nature.com/nphys/rss/current

任何人都知道他们的Feed类型是什么以及如何解析它们？

Answer 1

根据原始供稿本身（http://feeds.nature.com/nphys/rss/current?format=xml）它是RSS1格式，通过xmlns：前缀引入了一堆其他标签，这些标签为这些标签命名了特定的命名空间（例如rdf，prism，feedburner等））。因此，如果您忽略所有已声明的命名空间（例如，所有带有以<something:something>开头的标记或其名称中带冒号的属性，并且只是像使用RSS1 xml规范那样解析标记，那么您应该没问题。

Answer 2

它使用了root element中的内容：

<rdf:RDF 
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:prism="http://prismstandard.org/namespaces/basic/2.0/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:content="http://purl.org/rss/1.0/modules/content/" 
    xmlns="http://purl.org/rss/1.0/"
    xmlns:admin="http://webns.net/mvcb/" 
    xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0">

请参阅https://en.wikipedia.org/wiki/RDF_feed

各种附加XML namespaces使用其他XML应用程序中的元素扩展基本RDF文档。那些没有命名空间的元素是RSS 1.0元素，例如

<title>Nature Physics - Issue - nature.com science feeds</title>

这也由xmlns="http://purl.org/rss/1.0/"表示。

按照给定的URL了解有关该文档中使用的XML应用程序的更多信息。

您可以使用DOM或SimpleXML或XMLReader轻松解析该文档。

Nature Magazine使用什么类型的饲料？

2 个答案: