Ruby group_by具有不同键的哈希数组(键不固定)

时间:2017-01-26 14:14:13

标签: ruby-on-rails ruby

我想将哈希数组分组为:

array = [{"value"=>[{"a"=>1},{"b"=>4}]},{"value"=>[{"c"=>4},{"d"=>3},{"a"=>3},{"b"=>54}]}]

为:

grouped_data = {"a"=>[1,3],"b"=>[4,54],"c"=>[4],"d"=>[3]}

我可以将数组转换为 array#1 = [{"a"=>1}, {"b"=>4}, {"c"=>4}, {"d"=>3}, {"a"=>3}, {"b"=>54}]使用array.map(&:values).flatten。我可以使用循环覆盖所有数据,将array#1转换为散列grouped_data的方式。但我需要一种更有效的方法,比如使用group_by而非动态键(键不固定。)

我知道如果密钥是固定的,如何分组。我需要group_by动态更改密钥。

3 个答案:

答案 0 :(得分:2)

我不希望赢得任何可读性奖励......

array.map(&:values)
     .flatten
     .group_by { |o| o.keys.first }
     .map { |key, v| [key, v.map(&:values).flatten] }
     .to_h
=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>[4], "d"=>[3]}

如果有人好奇,我会把一些粗略的基准组合在一起:

require 'benchmark'

n = 10000
letters = ('a'...'z').to_a
numbers = (0...1000).to_a

built_array = []
n.times do |i|
  values = []
  obj_size = (1...letters.size).to_a.sample
  obj_size.times do |j|
    values << {
      "#{letters.sample}" => numbers.sample
    }
  end
  built_array << { "value" => values }
end

Benchmark.bm(15) do |x|
  x.report("anthony") { anthony(built_array) }
  x.report("eric each") { eric_each(built_array) }
  x.report("eric ewo") { eric_each_with_object(built_array) }
  x.report("eric merge") { eric_merge(built_array) }
  x.report("ed inject") { ed_inject(built_array) }
end

                      user     system      total        real
anthony           0.130000   0.010000   0.140000 (  0.146601)
eric each         0.060000   0.000000   0.060000 (  0.067160)
eric ewo          0.070000   0.000000   0.070000 (  0.076125)
eric merge       25.250000   0.880000  26.130000 ( 28.297592)
ed inject         0.080000   0.010000   0.090000 (  0.111045)

答案 1 :(得分:1)

您在这里有趣的数据结构:D

每个

array = [{ 'value' => [{ 'a' => 1 }, { 'b' => 4 }] }, { 'value' => [{ 'c' => 4 }, { 'd' => 3 }, { 'a' => 3 }, { 'b' => 54 }] }]

grouped_data = Hash.new { |h, k| h[k] = [] }

array.each do |subhash|
  subhash['value'].each do |subsubhash|
    subsubhash.each do |key, value|
      grouped_data[key] << value
    end
  end
end

p grouped_data
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>[4], "d"=>[3]}

each_with_object

使用您建议的代码,您也可以写:

grouped_data = Hash.new { |h, k| h[k] = [] }

p array.map(&:values).flatten.each_with_object(grouped_data){|subhash,data| 
  subhash.each do |k,v|
    data[k] << v
  end
}
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>[4], "d"=>[3]}

合并

另一种选择是合并:

p array.map(&:values).flatten.inject{|mem,hash| mem.merge(hash){|k,o,n| [o,n].flatten}}
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>4, "d"=>3}

请注意,输出不同。如果一个字母只有一个值,它将作为整数返回,而不是作为1个元素的数组返回。

答案 2 :(得分:1)

我同意Eric Duminil的观点。有趣的数据结构。

使用#inject

array = [{"value"=>[{"a"=>1},{"b"=>4}]},{"value"=>[{"c"=>4},{"d"=>3},{"a"=>3},{"b"=>54}]}]

new_hash = array.inject(Hash.new) do |h,o|
  o['value'].each do |sh|
    h[sh.keys[0]] = [] if h[sh.keys[0]].nil?
    h[sh.keys[0]] << sh.values[0] 
  end
  h
end

puts new_hash

这简直使用 #merge 击败了Eric的答案,但是会做到这一点:

#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>4, "d"=>3}