XML,HTML和XHTML文档的有效内容类型

时间:2010-06-03 11:46:06

标签: html xml http xhtml web-standards

XML,HTML和XHTML文档的正确内容类型是什么?

我需要编写一个只提取这类文件的简单抓取工具。

现在由于mod_rewrite,http://example.net/index.html可以提供JPEG文件,因此我需要检查响应头中的内容类型,并将其与允许的内容类型列表进行比较。

我在哪里可以获得这样的清单?

1 个答案:

答案 0 :(得分:178)

HTML:text/html,全程停止。

XHTML:application/xhtml+xml,或仅在遵循HTML兼容性指南text/html时。请参阅W3 Media Types Note

XML:text/xmlapplication/xmlRFC 2376)。

还有许多其他基于XML的媒体类型,例如application/rss+xmlimage/svg+xml。可以肯定的是,+xml中任何未被识别但已注册的结尾都是基于XML的。有关以+xml结尾的注册媒体类型,请参阅IANA list

(对于未注册的x-类型,所有投注都已关闭,但您希望+xml得到尊重。)