如何将此页面转换为utf8(with curl)

时间:2013-08-20 21:41:01

标签: php mongodb encoding

这是页面:http://www.stats.betradar.com/s4/gismo.php?&html=1&id=1828&language=tr&clientid=35&child=1&childnodeid=1819

我已经尝试了14个小时。并且找不到任何解决方案。

我必须使用curl获取数据并将它们转换为utf8并插入MONGODB。

但它不会发生。每次都会出现一些问题。

拜托,我该怎么办?

(当你用view-source看时:有些字符被改变为:ü=üİ=İŞ=&#350等。)

2 个答案:

答案 0 :(得分:0)

此页面上的所有非ASCII字符都编码为HTML实体/字符引用。使用html_entity_decode对它们进行解码,或使用XML解析器为您执行此操作。

答案 1 :(得分:0)

只有str_replace可以解决我的问题。这不是一个稳定的解决方案。 如果我找到所有不同的字符并将它们添加到“修复列表”中,它就可以解决。

这太难了