我需要用通用语言表示内容,也就是现在的 HTML5 标准 - 我的目标不是在网络浏览器中显示页面。我需要代表仅内容,没有界面,没有布局,没有逻辑(没有Javascript)。
在other questions(或programmers questions)和the W3C HTML5's Recommendation, "HTML vs XHTML" section中记住,
DOM,HTML语法和XHTML语法不能全部代表相同的内容。
好的,但是~90%可以是相同的(!),如果我不需要Javascript,样式等,我可以强制执行一些约束,它将是100%...所以,问题是关于我需要使用哪些约束(?)以确保所有序列化为XHTML5的HTML5都代表相同的东西,反之亦然(XSLT将支持原始HTML5文档)。
有一个“HTML5元素的子集”或“子集,带有一些附加约束”,可以确保reversibility的XHTML5 / HTML5转换?< / p>
答案 0 :(得分:1)
Polyglot Markup: A robust profile of the HTML5 vocabulary,目前是W3C Candidate Recommendation,定义了文档的规则
[...]这是一个字节流,当以HTML格式处理或作为XML处理时,会解析为相同的文档树(有一些例外,如Introduction中所述)。
您可以在section 4: Writing HTML documents中找到编写此类文档的规则。