PHP:如何摆脱像" \ u00a0"?

时间:2017-08-24 07:45:28

标签: php special-characters hidden-characters non-breaking-characters

我有一堆乱七八糟的JSON数据要导入我的数据库(为了进一步的目的)。当我检查它们(在文本编辑器中打开)时,它们包含许多奇怪的(乱码)字符,如:

  • \ u00a0

例如,data.json

[{"title":"hello world!","html_body":"<p>Hello\u00a0 from the\u00a0  other side.\u00a0 <\/p>"}]

然后,显然,在代码之下只需WON&#T; T work:

$clean = str_replace("\u00a0", "", $string);

尽管有这些角色,我怎么能摆脱它们呢?

2 个答案:

答案 0 :(得分:1)

如果您的单个字符串的末尾可能有不间断空格或换行符,则可以在使用以下方法将JSON数据放在一起时对它们进行裁剪:

$ dat = trim($ dat,“ \ t \ n \ r \ 0 \ x0B \ xc2 \ xa0”);

答案 1 :(得分:0)

感谢评论部分中的所有人,(至少)帮助我了解这些人non-breaking characters。然后我用谷歌搜索,无论如何都找到了一个有效的解决方案:

$clean_html_body = preg_replace('/\xc2\xa0/', '', $html_body);

再次感谢所有人。 :)