PHP将分隔的字符串拆分为键/值对(关联数组)

时间:2011-03-13 15:32:19

标签: php arrays string associative-array explode

我有一个这样的字符串:

key1\value1\key2\value2\key3\value3\key4\value4\key5\value5

我希望它是一个关联数组,以便我能做到:

echo $myArray['key1']; // prints value1
echo $myArray['key3']; // prints value3
//etc...

我知道我可以在反斜杠上爆炸,但不知道如何从那里开始。

5 个答案:

答案 0 :(得分:17)

使用简单的regex通过preg_match_allarray_combine通常是最短且最快的选择:

 preg_match_all("/([^\\\\]+)\\\\([^\\\\]+)/", $string, $p);
 $array = array_combine($p[1], $p[2]);

现在这当然是一个特例。 都由 \ 反斜杠分隔,就像它们的所有对一样。由于必要的双重转义,正则表达式也有点长。

但是,这个方案可以推广到其他key:value, - 样式的字符串。

不同的key:value,分隔符

常见变体包括 = 作为键/值分隔符,& 等作为对分隔符。在这种情况下,正则表达式变得相当明显(/x标志是为了便于阅读):

 #                    ↓    ↓    ↓
 preg_match_all("/ ([^:]+) : ([^,]+) /x", $string, $p);
 $array = array_combine($p[1], $p[2]);

这使得与其他分隔符交换:,非常容易。

  • 等号=而不是:冒号。
  • 例如\\t作为对分隔符(制表符分隔键:值列表)
  • 经典&;作为键=值对之间的分隔符。
  • 或仅\\s个空格或\\n换行符。

允许不同的分隔符

通过在键/值/对之间允许不同的分隔符,可以使其更灵活/更宽容:

 #                    ↓      ↓       ↓
 preg_match_all("/ ([^:=]+) [:=]+ ([^,+&]+) /x", $string, $p);

两个key=value,key2:value2++key3==value3都有效。这对于更多人类友好的人来说是有意义的(AKA非技术用户)。

约束字母数字键

通常,您可能希望禁止除经典key标识符之外的任何内容。只需使用\w+字符串模式使正则表达式跳过不必要的出现:

 #                   ↓   ↓    ↓
 preg_match_all("/ (\w+) = ([^,]+) /x", $string, $p);

这是最琐碎的白名单方法。如果OTOH要事先断言 /约束整个键/值字符串,那么制作一个单独的preg_match("/^(\w+=[^,]+(,|$))+/", …

剥离空格或引用

您可以跳过一些后处理步骤(例如关键字和值的trim),只需添加一小部分:

 preg_match_all("/ \s*([^=]+) \s*=\s* ([^,]+) (?<!\s) /x", $string, $p);

或者例如可选引号:

 preg_match_all("/ \s*([^=]+) \s*=\s* '? ([^,]+) (?<![\s']) /x", $string, $p);

INI式提取

您可以制作基线INI文件提取方法:

 preg_match_all("/^ \s*(\w+) \s*=\s* ['\"]?(.+?)['\"]? \s* $/xm", $string, $p);

请注意,这只是常见INI方案的粗略子集

替代方案:parse_str()

如果您已经有key=value&key2=value2字符串,那么parse_str就像魅力一样。但是将它与strtr结合起来甚至可以处理不同的其他分隔符:

 #                         ↓↓    ↑↑
 parse_str(strtr($string, ":,", "=&"), $pairs);

其中有一些优点和缺点

  • 甚至比双线正则表达法更短。
  • 预定义一个众所周知的转义机制,例如%2F表示特殊字符。
  • 不允许使用不同的分隔符或未转义的分隔符。
  • 自动将keys[]=转换为您可能想要或不想要的数组。

替代方案:explode + foreach

你会发现很多manual key/value string expansion的例子。虽然这通常是更多的代码。由于优化假设,explode在PHP中有些过度使用。然而,由于手动foreach和数组集合,分析经常变慢。

答案 1 :(得分:6)

这样的事情:

$str = 'key1\value1\key2\value2\key3\value3\key4\value4\key5\value5';
$list = explode('\\', $str);

$result = array();
for ($i=0 ; $i<count($list) ; $i+=2) {
    $result[ $list[$i] ] = $list[$i+1];
}

var_dump($result);

哪能得到你:

array
  'key1' => string 'value1' (length=6)
  'key2' => string 'value2' (length=6)
  'key3' => string 'value3' (length=6)
  'key4' => string 'value4' (length=6)
  'key5' => string 'value5' (length=6)


基本上,这里的想法是:

  • 拆分字符串
  • 会为您提供'key1', 'value1', 'key2', 'value2', ...
  • 等数组
  • 然后,每次使用2次跳转迭代此列表:
    • 一个元素作为键 - 由$i
    • 指向的元素
    • 紧随其后的那个值 - $i+1
    • 指向的值

答案 2 :(得分:0)

我对RegExp不太好,但这个行代码怎么样

parse_str(preg_replace("/key(.*?)\\value(.*?)(\\|$)/", "key$1=value$2&", $input_lines), $output);

答案 3 :(得分:0)

分成多个段,并以两个递增循环。

$str = 'php\127\typescript\12\jquery\120\angular\50';
$segments = explode('\\', $str);
$data = [];
for ($i = 0, $count = count($segments) - 1; $i < $count; $i += 2) {
    $data[$segments[$i]] = $segments[$i + 1];
}

输出

array(4) {
  'php'        => string(3) "127"
  'typescript' => string(2) "12"
  'jquery'     => string(3) "120"
  'angular'    => string(2) "50"
}

答案 4 :(得分:0)

@Wasim的答案

  1. 不能按发布方式工作,并且
  2. 其中@mario列出了其使用的注意事项
通过组合使用否定的字符类和转义的反斜杠来建立查询字符串,可以改进

或使其更加灵活。

代码:(Demo

parse_str(preg_replace('/([^\\\\]+)\\\\([^\\\\]+)\\\\?/', '$1=$2&', $string), $output);
var_export($output);

输出:

array (
  'key1' => 'value1',
  'key2' => 'value2',
  'key3' => 'value3',
  'key4' => 'value4',
  'key5' => 'value5',
)