什么是非utf-8字符(不是代码点)的示例?

时间:2015-04-16 15:41:44

标签: php encoding utf-8

我试图测试我的代码以确保它只接受utf-8字符。用户可以发送一个名称作为输入,我想确保这个名称不是utf8的其他名称。

我知道您可以使用二进制格式构建非utf8字符,但据我所知,用户无法以二进制格式发送输入。用户可以键入的字符示例是什么,utf-8不支持。

BTW我在php中编写代码,默认的encoing是utf-8。

1 个答案:

答案 0 :(得分:0)

如果您要寻找字符串进行测试,请参考以下内容:

  • İnançEsasları
  • 你好世界
  • pythön!

一个简单的函数来检查utf8是否在您的字符串中:

if (mb_strlen($var, 'UTF-8') != strlen($var)) {
  // handle when not UTF-8
}