得到UNICODE字符而不是HEX - cURL PHP

时间:2017-06-30 00:05:03

标签: php unicode encoding utf-8 php-curl

我正在使用this剪贴板进行IMDB,问题是某些字符位于UNICODE ï中。 我将这个剪贴板与CURL一起使用,答案是以UTF8编码的字符串 我尝试使用 mb_detect_encoding()获取字符串的编码,然后用UTF-8回答

$html = $this->geturl("${imdbUrl}combined");
mb_detect_encoding($html);

所以我有一个包含一些HEX值的字符串,例如:

$var = 'Saïd Taghmaoui'

所以我尝试用 utf8_decode()获取$ html的值,但没有运气,我仍然在HEX中有一些字符。

所以我有几个问题:

1-什么是最佳解决方案?我想象不同的场景,例如读取字符串并使用REGEX更改所有带有字符的HEX代码,但我不确定这个是否是最佳解决方案,而且我也不知道如何为此创建REGEX。 / p>

2-解决方案可以通过cURL?我的意思是管理一些配置来设置UTF-8的cURL编码?

我尝试使用函数 recode_string iconv mb_convert_encoding

1 个答案:

答案 0 :(得分:0)

基本上我的问题是Scrapper的答案带有UTF-8编码,但在打印文本之前我需要用这个函数来处理数据

$var = 'Saïd Taghmaoui'
htmlspecialchars(html_entity_decode($var, ENT_QUOTES, 'UTF-8'), ENT_NOQUOTES, 'UTF-8');