我意识到UTF-8是标准,但我有理由想要ASCII。我发现很好的参考资料表明50%的网站使用UTF-8,而极少数网站使用UTF-16。
http://www.w3.org/International/questions/qa-html-encoding-declarations#httpheadwhat
但我只使用ASCII字符集,所以我希望我的页面能够解释/解析。另外,我不想猜测是否正在使用BOB。使用ASCII,我的理解不存在。
如何为我的XHTML文档设置ASCII编码?
答案 0 :(得分:2)
由于ASCII是UTF-8的合适子集,你可以幸福地声明UTF-8编码,它没有任何区别。
实际上,将ANSI_X3.4-1968
或US-ASCII
指定为defined by the IANA可能更好,因为可以预期某天可能会被弃用(或者可以希望)。
答案 1 :(得分:2)
我怀疑你没有使用ASCII。 ASCII是一种在20世纪60年代开发的7位编码。今天的大多数工具集都不会将其输入限制为7位。我怀疑你使用的任何需要单字节字符集的传统工具实际上都使用ISO-8859-1或其他类似的传统字符集(如CP-1252或DOS代码页437)。
如果是这种情况,那么将文件显示为ASCII是一个错误,并且将来会导致渲染问题。
无论如何,我强烈建议您更新工具链以使用Unicode。
Unicode是XML的基础,它是XHTML的基础。 Unicode是Windows,.NET Framework,Linux,iOS以及过去20年中开发的所有其他软件平台的本机字符串格式。 Unicode是网络的主要编码。
任何浏览器都必须在显示之前将非Unicode页面转换为Unicode。
系统中任何位置的旧版字符编码都是维护的负担。它们是对您的系统征税,必须在每个界面为每次修改支付。他们是一个臭虫工厂。
Unicode允许您将文本从任何地方发送到任何地方,而不必担心文本将如何在某个地方被搞砸。
20世纪(而不是21世纪)是世界大战,天花和传统角色编码的合适场所。那些东西应该留在他们所属的过去。
转换为Unicode是您需要进行的更改。你可以做出改变。西联汇款不再发送电报。旋转手机很少见。未来就在这里,它的名字是Unicode!
(另外,你应该接受Strangelove博士的建议并“学会停止担心并喜欢BOM。”:D)
答案 2 :(得分:1)
是的,你可以。您只需要使用数字字符引用表示任何非ASCII字符(例如,€
而不是€
)。