即使使用UTF-8,Unicode字体也显示为垃圾

时间:2012-04-18 15:28:29

标签: migration encoding linux

我有一些带有unicode内容的博客,只是将它们迁移到新的服务器CentOS - Apache。现在,unicode字体显示为垃圾,我不确定出了什么问题。

我的wp-config和Apache AddDefaultCharset设置为UTF-8。不过,我看到了垃圾。

顺便说一句,同一台服务器在非WP页面中很好地提供了Unicode内容。但是,这三个WP网站都有这个问题。

示例内容: à®...àà'கிà®àநிறமà¯à®Ÿà¯à®àààªà®šà¯à®šà¯à®•à A®•à®¿à®³à®¿à®¯à¯‡,

My DB details:mysql> show variables like 'char%';
+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | latin1                     | 
| character_set_connection | latin1                     | 
| character_set_database   | latin1                     | 
| character_set_filesystem | binary                     | 
| character_set_results    | latin1                     | 
| character_set_server     | latin1                     | 
| character_set_system     | utf8                       | 
| character_sets_dir       | /usr/share/mysql/charsets/ | 
+--------------------------+----------------------------+
8 rows in set (0.00 sec)

请让我知道如何更改它,以便现有的数据库内容的编码也会发生变化。

1 个答案:

答案 0 :(得分:1)

您的数据已被误编码。它的UTF-8数据被解释为CP1252。

>>> print u'அழகிய நிறம'.encode('cp1252').decode('utf-8')
அழகிய நிறம