将未知字符转换为可读字符

时间:2016-11-18 19:31:38

标签: php utf-8 character-encoding

我正在从this这样的页面读取信息并将其放入我自己的数据库中。我对名称和分类等数据感兴趣。在此示例中,名称为Flabébé,分类为Single Bloom Pokémon。当我在屏幕上查看信息时,我会每é(e-acute)获得一个 。如果我将它存储在我的数据库中,它会在每次e-acute之前切断。

我尝试了互联网上的许多建议,但似乎都没有。我无法绕过它。我最终得到了这个,但没有结果:

html_entity_decode($classification, ENT_COMPAT, 'UTF-8');

PHP页面字符集在标题中设置为utf-8,也在HTML标题中设置。我的数据库连接的charset也设置为utf-8。我在这里做错了什么?

1 个答案:

答案 0 :(得分:0)

由于Tom K的回答,我解决了这个问题。它使用文本编码Windows-1252。所以我必须像这样将它转换为UTF-8:

mb_convert_encoding($classification, "UTF-8", "Windows-1252");