我尝试使用php和几个不同的rss / atom阅读器解析自然杂志的feed,但我找不到合适的阅读方法。
他们的饲料结构对我来说很不可思议,但肯定不是RSS,但在原子阅读器的帮助下,我也无法得到任何正确的答案。
任何人都知道他们的Feed类型是什么以及如何解析它们?
答案 0 :(得分:1)
根据原始供稿本身(http://feeds.nature.com/nphys/rss/current?format=xml)它是RSS1格式,通过xmlns:前缀引入了一堆其他标签,这些标签为这些标签命名了特定的命名空间(例如rdf,prism,feedburner等) )。因此,如果您忽略所有已声明的命名空间(例如,所有带有以<something:something>
开头的标记或其名称中带冒号的属性,并且只是像使用RSS1 xml规范那样解析标记,那么您应该没问题。
答案 1 :(得分:1)
它使用了root element中的内容:
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:prism="http://prismstandard.org/namespaces/basic/2.0/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns="http://purl.org/rss/1.0/"
xmlns:admin="http://webns.net/mvcb/"
xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0">
请参阅https://en.wikipedia.org/wiki/RDF_feed
各种附加XML namespaces使用其他XML应用程序中的元素扩展基本RDF文档。那些没有命名空间的元素是RSS 1.0元素,例如
<title>Nature Physics - Issue - nature.com science feeds</title>
这也由xmlns="http://purl.org/rss/1.0/"
表示。
按照给定的URL了解有关该文档中使用的XML应用程序的更多信息。
您可以使用DOM
或SimpleXML
或XMLReader
轻松解析该文档。