编码ISO-8859-1中的特殊字符

时间:2015-09-04 04:25:28

标签: encoding character-encoding urlencode

如何 - 或“或”在ISO-8859-1中编码?

我已将此文档http://www.ic.unicamp.br/~stolfi/EXPORT/www/ISO-8859-1-Encoding.html引用,但未找到任何编码 - 或“或”。

1 个答案:

答案 0 :(得分:2)

使用ISO8859-1 (特别是因为它可能缺少您想要的字符的编码)。像今天大多数应用程序一样使用UTF-8。见UTF8everywhere

Euro sign上阅读wikipage。它告诉你€是Unicode U + 20AC,用UTF-8表示,带有0xE2 0x82 0xAC代码,即用C八进制字符串语法:"\342\202\254"

在我的Debian / Linux上我使用gucharmap字符映射应用程序来查找这样的编码。您在网络上有很多关于UTF-8的资源:hereherehere等......

在2015年编写或改进的软件中,没有理由使用ISO-8859-1而不是UTF-8

仅作为历史参考,ISO-8859-1中不存在欧元符号€(因为它出现在1985年,由{1992} Euro计划的Maastricht treaty于2002年到达)但仅限于ISO-8859-15,但您应使用UTF-8

如果您坚持(错误地)使用ISO8859-x 不推荐使用的编码,您的用户将会感到不安,因为越来越多的应用程序,客户端,浏览器......不再使用它。世界已经转向UTF-8,它还具有能够显示许多字母(包括西里尔或阿拉伯语)和字形的优势。

如果您的软件使用ISO8859-1编码的数据库,则应考虑将它们(数据库和软件代码)转换为UTF-8。这通常很容易(当然,如果您的数据库和软件很庞大或很关键,您应该仔细规划转换)。