应用错误收集

时间：2012-11-09 10:52:15

标签： html unicode utf-8 character-encoding

我最近听说在网站上使用UTF-8（或Unicode）字符集时不再需要对HTML特殊字符进行编码。

我指的是非ASCII字符，例如«（＆amp; laquo;）， - （＆amp; mdash;）等。 HTML中保留的字符当然应该被转义（＆gt;，“等等）。

如果是真的，准备在网上发布的大文本将比以前容易得多。

答案 0 :(得分：5)

在浏览器支持UTF时，从未要求在使用UTF-8时“编码”字符（使用—等字符引用或—等实体引用来转义它们） 8首先。唯一的例外是小于号字符“＆lt;”和＆符号“＆amp;”，它们需要独立于编码进行转义。（好吧，引号不能在引号属性值中使用，它与分隔符具有相同的标记，但通常可以避免这种情况。）

你可能仍然使用转义符号。如果您希望您或其他人必须编辑HTML文档，以便创作工具没有适当的UTF-8支持，则可以这样做。您也可能这样做，因为您正在键入文本并且没有方便的工具来插入所有字符。但这些都是例外。

答案 1 :(得分：1)

这是真的。

自UTF-8接手以来，使用HTML实体（特殊字符除外）已经过时了。