我最近听说在网站上使用UTF-8(或Unicode)字符集时不再需要对HTML特殊字符进行编码。
我指的是非ASCII字符,例如«(& laquo;), - (& mdash;)等。 HTML中保留的字符当然应该被转义(>,“等等)。
如果是真的,准备在网上发布的大文本将比以前容易得多。
答案 0 :(得分:5)
在浏览器支持UTF时,从未要求在使用UTF-8时“编码”字符(使用—
等字符引用或—
等实体引用来转义它们) 8首先。唯一的例外是小于号字符“<”和&符号“&”,它们需要独立于编码进行转义。 (好吧,引号不能在引号属性值中使用,它与分隔符具有相同的标记,但通常可以避免这种情况。)
你可能仍然使用转义符号。如果您希望您或其他人必须编辑HTML文档,以便创作工具没有适当的UTF-8支持,则可以这样做。您也可能这样做,因为您正在键入文本并且没有方便的工具来插入所有字符。但这些都是例外。
答案 1 :(得分:1)
这是真的。
自UTF-8接手以来,使用HTML实体(特殊字符除外)已经过时了。