我有一个希腊语文本,我想将其转换为没有空格的十六进制代码点。只需一大串文字。
这正是我想要的 - > Unicode Hexadecimal code points for PHP但它没有提供实际代码,如何做到这一点。
答案 0 :(得分:5)
基于original code以及此问题的答案:How to get code point number for a given character in a utf-8 string?我将此功能放在一起:
function utf8_to_unicode($str) {
$unicode = array();
$values = array();
$lookingFor = 1;
for ($i = 0; $i < strlen($str); $i++) {
$thisValue = ord($str[$i]);
if ($thisValue < 128)
$unicode[] = str_pad(dechex($thisValue), 4, "0", STR_PAD_LEFT);
else {
if (count($values) == 0) $lookingFor = ($thisValue < 224) ? 2 : 3;
$values[] = $thisValue;
if (count($values) == $lookingFor) {
$number = ($lookingFor == 3) ?
(($values[0] % 16) * 4096) + (($values[1] % 64) * 64) + ($values[2] % 64):
(($values[0] % 32) * 64) + ($values[1] % 64);
$number = strtoupper(dechex($number));
$unicode[] = str_pad($number, 4, "0", STR_PAD_LEFT);
$values = array();
$lookingFor = 1;
} // if
} // if
} // for
return ($unicode);
} // utf8_to_unicode
所以:
$greekString = "ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ ";
$hexArray = utf8_to_unicode($greekString);
echo implode("", $hexArray);
将输出:
039103920393039403950396039703980399039A039B039C039D039E039F03A003A103A303A403A503A603A703A803A90032
答案 1 :(得分:0)
这对我有用:
header('Content-Type: text/html; charset=utf-8');
bin2hex(iconv('UTF-8', 'UTF-16BE', 'your message'));