我已经尝试了14个小时。并且找不到任何解决方案。
我必须使用curl获取数据并将它们转换为utf8并插入MONGODB。
但它不会发生。每次都会出现一些问题。
拜托,我该怎么办?
(当你用view-source看时:有些字符被改变为:ü=üİ=İŞ=&#350等。)
答案 0 :(得分:0)
此页面上的所有非ASCII字符都编码为HTML实体/字符引用。使用html_entity_decode
对它们进行解码,或使用XML解析器为您执行此操作。
答案 1 :(得分:0)
只有str_replace可以解决我的问题。这不是一个稳定的解决方案。 如果我找到所有不同的字符并将它们添加到“修复列表”中,它就可以解决。
这太难了