我正在尝试从字符串中提取压缩的十六进制数字。我的应用程序正在与服务器进行通信,该服务器发送一个带有标头的字符串,后跟2个字节的十六进制数字。这个字符串中有数千个数字。
我想要做的是提取每个2字节的压缩数字,并将其转换为我可用于执行计算的数字。
示例:string = "info:\x00\x00\x11\x11\x22\x22"
将生成三个数字0x0000
(十进制0),0x1111
(十进制4369),0x2222
(十进制8738)
我有一个可行的解决方案(见下文),但当我尝试处理服务器发送的数千个号码时,它的运行速度太慢。请提供一些建议,以加快我的方法。
//Works but is too slow!
//$string has the data from the server
$arrayIndex = 0;
for($index = [start of data]; $index < strlen($string); $index+=2){
$value = getNum($string, $index, $index+1);
$array[$arrayIndex++] = $value;
}
function getNum($string, $start, $end){
//get the substring we're interested in transforming
$builder = substr($string, $start, $end-$start+1);
//convert into hex string
$array = unpack("H*data", $builder);
$answer = $array["data"];
//return the value as a number
return hexdec($answer);
}
我也一直在尝试在单个解包命令中提取数字,但这不起作用(我在理解要使用的格式字符串时遇到一些麻烦)
//Not working alternate method
//discard the header (in this case 18 bytes) and put the rest of the
//number values I'm interested in into an array
$unpacked = unpack("c18char/H2*data", $value);
for($i = 0; $i < $size; $i+=1){
$data = $unpacked["data".$i];
$array[$i] = $data;
}
答案 0 :(得分:2)
$array = array();
$len = strlen($string);
for($index = [start of data]; $index < $len; $index+=2){
$d = unpack("H*data", substr($string, $index, 2));
$array[] = hexdec($d["data"]);
}
我做的唯一重要的事情是缓存strlen的值并减少函数调用。
你也可以试试这个
foreach (str_split(substr($string, [start of data]), 2) as $chunk) {
$d = unpack("H*data", $chunk);
$array[] = hexdec($d["data"]);
}
答案 1 :(得分:1)
我可以建议的一件事是通过引用传递包含数千个十六进制数字的字符串,而不是值。如果有3k数字,则字符串长12k个字符,多个3k函数调用导致~36M(如果每个字符使用一个字节,~72M,如果utf8),则不需要在堆栈上分配内存:
$arrayIndex = 0;
for($index = [start of data]; $index < strlen($string); $index+=2){
$value = getNum($string, $index, $index+1);
$array[$arrayIndex++] = $value;
}
//pass by reference rather than value
function getNum(&$string, $start, $end){
//get the substring we're interested in transforming
//$builder = substr($string, $start, $end-$start+1);
//not sure if substr takes reference or value, so implementing this way, just in case it's by value
$builder = $string[$start] . $string[$start + 1] ;
//convert into hex string
$array = unpack("H*data", $builder);
$answer = $array["data"];
//return the value as a number
return hexdec($answer);
}
不确定这加快了多少(内存分配肯定),但绝对值得一试。
答案 2 :(得分:0)
为什么不尝试这样的事情:
$string = "info:\x00\x00\x11\x11\x22\x22";
$ret = array();
preg_match_all('#\\x(\d{2})#', $string, $items);
if(isset($items[1]) && count($items[1])>0)
{
for($i=0;$i<count($items[1]);$i+=2)
{
if(isset($items[1][$i]) && isset($items[1][$i+1]))
{
$ret[] = '0x' . $items[1][$i] . $items[1][$i+1];
unset($items[1][$i]);
unset($items[1][$i+1]);
}
}
}