PHP char编码为各种来源的UTF-8

时间:2011-03-05 14:19:45

标签: php utf-8 character-encoding

嘿,伙计们。我为http://pastebin.com工作,我们对新的API和字符编码存在一些问题。

在网站上我们运行一个元标记,指定网站上的所有内容,包括表单,都是utf-8。因此,所有字符都以正确的方式存储,而无需修改任何字符类型。

然而,使用API​​,人们可以从各种不同来源发送数据。表格,因此必须在存储之前进行检查并可能进行更改。

提出问题的字符例如:

고객님이티빙

Iñtërnâtiônàlizætiøn ♥♥♥♥♥

идитев*оопу,онлучший)

将这些数据输入到API的好方法是什么,以确保所有字符都以有效的UTF-8格式存储,这将在我们的网站上运行。

2 个答案:

答案 0 :(得分:1)

重复:What is the best way to handle uploaded text files of different encodings?

简而言之,唯一可靠的方法是让客户端指定他们使用的编码。自动编码检测不完善,往往不可靠。

例如,如果传入数据不是UTF-8,则可以指定传入数据需要指定编码。

答案 1 :(得分:1)

假设您的客户端正确发送utf8数据和标题:听起来您正在对已编码的utf8数据执行utf8_encode()。