在PHP中清理令人讨厌的字符

时间:2010-04-08 09:49:41

标签: php utf-8

我的客户端将Word中的内容粘贴到CMS中的小文本编辑器中时出现了一些问题。

双引号会以某种形式的UTF编码回来。

任何想法,如果我可以使用PHP从mySQL表中显示它们时删除/替换它们。

这是指向吐出狡猾角色的页面的链接,你可以看到引起头痛的'厄运黑钻'。

http://linq.milkbarstudios.com/news_detail.php?id=3

任何建议都会被大大接受!

2 个答案:

答案 0 :(得分:2)

这听起来像是代码中的错误。处理文本数据时,必须始终考虑编码并根据需要来回转换。因此,当浏览器向您发送UTF-8时,您必须先解码该字符串,然后再将其发送到数据库(MySQL确实在文本列中支持UTF-8)。这样,原始文本将被保留。当然,在渲染浏览器页面时必须这样做(将字符集设置为UTF-8,确保实际发送UTF-8等)。

答案 1 :(得分:0)

我实际上是在寻找PHP来取代狡猾的角色。

最后我找到了这个,它完美地修复了它:

$output = preg_replace('/[^(\x20-\x7F)]*/','', $output);