PHP Unicode字符检测

时间:2013-03-20 13:20:08

标签: php unicode

我正在尝试从某个网页获取内容,并用另一个子字符串替换下一个标记:'。它不是常规撇号,甚至substr_count($content,"’")返回0。 好像我无法检测到那个标记,因此无法使用substr_replace替换他。

我该如何处理这个问题?

提前致谢。

2 个答案:

答案 0 :(得分:2)

源代码中的$content字符很可能不在同一个编码中。 substr_count逐字节比较。源代码中的字符具有字节表示,但您的PHP文件已编码。 $content具有其所在编码的编码。如果两者不匹配,则不会找到子字符串。

$content转换为您正在使用的某些标准化编码。

阅读What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text

答案 1 :(得分:1)

如果您正在使用unicode字符。使用多字节字符串函数

是明智的

http://www.php.net/manual/en/function.mb-substr-count.php