如何有效地将两个(或更多)关联数组与公共键组合在一起

时间:2011-02-25 22:45:08

标签: php python arrays merge

更一般地说,假设我们有两个不同长度的列表,它们有一个共同的属性:

list1: {
         {"orderID":1234, "FirstName":"shaheeb", "LastName":"roshan"},
         {"orderID":9183, "FirstName":"robert", "LastName":"gibbons"},
         {"orderID":2321, "FirstName":"chester"},
       }
list2: {
         {"orderID":1234, "cell":"555-555-5555", "email":"roshan@fake.com"},
         {"orderID":2321, "email":"chester@fake.com"},
       }

我希望将这些组合成:

list3: {
         {"orderID":1234, "FirstName":"shaheeb", "LastName":"roshan", "cell":"555-555-5555", "email":"roshan@fake.com"},
         {"orderID":9183, "FirstName":"robert", "LastName":"gibbons"},
         {"orderID":2321, "FirstName":"chester", "email":"chester@fake.com"},
       }

我主要是一名PHP开发人员,我想出了以下内容:

function mergeArrays($a1, $a2) {
    $larger = (count($a1) > count($a2)) ? $a1 : $a2;
    $smaller = ($larger == $a1) ? $a2 : $a1;
    $combinedArray = array();
    foreach ($larger AS $key=>$largerSet) {
        $combinedRow = array();
        if (isset ($smaller[$key]) ) {
            $combinedRow = $largerSet + $smaller[$key];
            $combinedArray[$key] = $combinedRow;
        }else {
            $combinedArray[$key] = $largerSet;
        }
    }
    return ($combinedArray);
}

如果使用以下测试:

$array1 = array("12345"=>array("OrderID"=>12345, "Apt"=>"blue"));
$array2 = array(
                "12345"=>array("OrderID"=>12345, "AnotherCol"=>"Goons", "furtherColumns"=>"More Data"),
                "13433"=>array("OrderID"=>32544, "Yellow"=>"Submarine")
            );

mergeArrays($ array1,$ array2)输出以下内容:

array(2) {
  [12345]=>
  array(4) {
    ["OrderID"]=>
    int(12345)
    ["AnotherCol"]=>
    string(5) "Goons"
    ["furtherColumns"]=>
    string(9) "More Data"
    ["Apt"]=>
    string(4) "blue"
  }
  [13433]=>
  array(2) {
    ["OrderID"]=>
    int(32544)
    ["Yellow"]=>
    string(9) "Submarine"
  }
}

但我觉得这不是最优雅的解决方案。例如,我应该能够组合n个数组。我不确定如何实现这一目标。另外,只要看一下这段代码,我就相当确定有更有效的方法来完成这个要求。

作为一个学习点,我很好奇python专家是否会借此机会向我们展示PHP民间:)。就此而言,我很好奇Excel / VBA是否能够处理这个问题。这就是我开始尝试解决这个问题的想法,“当然excel可以处理列表!”。

我完全清楚这个问题有很多变化。我已经看过其中的几个,但仍觉得我应该在这里试试我的版本。

您的想法非常受欢迎。

谢谢!

SR

3 个答案:

答案 0 :(得分:4)

对于Python中的一般解决方案,对于任意数量的列表:

orders = defaultdict(dict)
for order_list in order_lists:
    for order in order_list:
        orders[order['orderID']].update(order)

查看在线工作:ideone

答案 1 :(得分:2)

一个通用的解决方案,可以合并任意数量的dicts(或一个dicts列表 - 如果你有多个列表,只需在调用函数之前将它们加在一起):

from collections import defaultdict

def merge_dicts_by_key(key, *dicts):
    return reduce(lambda acc,val: acc[val[key]].update(val) or acc,
                  dicts,
                  defaultdict(dict))

这样打电话:

merge_dicts_by_key('orderId', dict1, dict2, dict3)

或者,如果您有dicts列表:

merge_dicts_by_key('orderId', *list_of_dicts)
merge_dicts_by_key('orderId', *(list1 + list2))

答案 2 :(得分:1)

好吧,你总是可以用array_merge_recursive替换你的功能。