我有一堆乱七八糟的JSON数据要导入我的数据库(为了进一步的目的)。当我检查它们(在文本编辑器中打开)时,它们包含许多奇怪的(乱码)字符,如:
例如,data.json
:
[{"title":"hello world!","html_body":"<p>Hello\u00a0 from the\u00a0 other side.\u00a0 <\/p>"}]
然后,显然,在代码之下只需WON&#T; T work:
$clean = str_replace("\u00a0", "", $string);
尽管有这些角色,我怎么能摆脱它们呢?
答案 0 :(得分:1)
如果您的单个字符串的末尾可能有不间断空格或换行符,则可以在使用以下方法将JSON数据放在一起时对它们进行裁剪:
$ dat = trim($ dat,“ \ t \ n \ r \ 0 \ x0B \ xc2 \ xa0”);
答案 1 :(得分:0)
感谢评论部分中的所有人,(至少)帮助我了解这些人non-breaking characters
。然后我用谷歌搜索,无论如何都找到了一个有效的解决方案:
$clean_html_body = preg_replace('/\xc2\xa0/', '', $html_body);
再次感谢所有人。 :)