现在我要说可怕的'E'字。编码。我知道整个互联网上都有covered to death,但我需要澄清一些事情。
现在我有一个脚本,其字符集是ISO-8559-1,并且它写入了一系列latin1_swedish_ci字段。这些字段中的数据虽然不准确,但我的字符串中有ê和ç的符号。这些显然是“非标准”角色。
现在谈到输出时,如果我在ISO-8859-1中提供HTML,我的内容无法正确呈现,但是当我使用UTF-8时 它的确如此。
现在回答问题:
我假设数据库错误地将数据存储到人眼,因为它需要使用多个字节,这是正确的吗?
为什么大多数符号在使用UTF-8字符集时都能正确呈现,但在使用ISO时却没有?
为了让所有字符都保存在数据库中并正确呈现,我假设我需要始终使用UTF-8。向前移动你会接受命中还是可以接受将这种数据保存在数据库中并每次转换它。我们有很多非英语字符。
由于
理查德