XML,HTML和XHTML文档的正确内容类型是什么?
我需要编写一个只提取这类文件的简单抓取工具。
现在由于mod_rewrite,http://example.net/index.html可以提供JPEG文件,因此我需要检查响应头中的内容类型,并将其与允许的内容类型列表进行比较。
我在哪里可以获得这样的清单?
答案 0 :(得分:178)
HTML:text/html
,全程停止。
XHTML:application/xhtml+xml
,或仅在遵循HTML兼容性指南text/html
时。请参阅W3 Media Types Note。
XML:text/xml
,application/xml
(RFC 2376)。
还有许多其他基于XML的媒体类型,例如application/rss+xml
或image/svg+xml
。可以肯定的是,+xml
中任何未被识别但已注册的结尾都是基于XML的。有关以+xml
结尾的注册媒体类型,请参阅IANA list。
(对于未注册的x-
类型,所有投注都已关闭,但您希望+xml
得到尊重。)