我想将哈希数组分组为:
array = [{"value"=>[{"a"=>1},{"b"=>4}]},{"value"=>[{"c"=>4},{"d"=>3},{"a"=>3},{"b"=>54}]}]
为:
grouped_data = {"a"=>[1,3],"b"=>[4,54],"c"=>[4],"d"=>[3]}
我可以将数组转换为
array#1 = [{"a"=>1}, {"b"=>4}, {"c"=>4}, {"d"=>3}, {"a"=>3}, {"b"=>54}]
使用array.map(&:values).flatten
。我可以使用循环覆盖所有数据,将array#1
转换为散列grouped_data
的方式。但我需要一种更有效的方法,比如使用group_by而非动态键(键不固定。)
我知道如果密钥是固定的,如何分组。我需要group_by动态更改密钥。
答案 0 :(得分:2)
我不希望赢得任何可读性奖励......
array.map(&:values)
.flatten
.group_by { |o| o.keys.first }
.map { |key, v| [key, v.map(&:values).flatten] }
.to_h
=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>[4], "d"=>[3]}
如果有人好奇,我会把一些粗略的基准组合在一起:
require 'benchmark'
n = 10000
letters = ('a'...'z').to_a
numbers = (0...1000).to_a
built_array = []
n.times do |i|
values = []
obj_size = (1...letters.size).to_a.sample
obj_size.times do |j|
values << {
"#{letters.sample}" => numbers.sample
}
end
built_array << { "value" => values }
end
Benchmark.bm(15) do |x|
x.report("anthony") { anthony(built_array) }
x.report("eric each") { eric_each(built_array) }
x.report("eric ewo") { eric_each_with_object(built_array) }
x.report("eric merge") { eric_merge(built_array) }
x.report("ed inject") { ed_inject(built_array) }
end
user system total real
anthony 0.130000 0.010000 0.140000 ( 0.146601)
eric each 0.060000 0.000000 0.060000 ( 0.067160)
eric ewo 0.070000 0.000000 0.070000 ( 0.076125)
eric merge 25.250000 0.880000 26.130000 ( 28.297592)
ed inject 0.080000 0.010000 0.090000 ( 0.111045)
答案 1 :(得分:1)
您在这里有趣的数据结构:D
array = [{ 'value' => [{ 'a' => 1 }, { 'b' => 4 }] }, { 'value' => [{ 'c' => 4 }, { 'd' => 3 }, { 'a' => 3 }, { 'b' => 54 }] }]
grouped_data = Hash.new { |h, k| h[k] = [] }
array.each do |subhash|
subhash['value'].each do |subsubhash|
subsubhash.each do |key, value|
grouped_data[key] << value
end
end
end
p grouped_data
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>[4], "d"=>[3]}
使用您建议的代码,您也可以写:
grouped_data = Hash.new { |h, k| h[k] = [] }
p array.map(&:values).flatten.each_with_object(grouped_data){|subhash,data|
subhash.each do |k,v|
data[k] << v
end
}
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>[4], "d"=>[3]}
另一种选择是合并:
p array.map(&:values).flatten.inject{|mem,hash| mem.merge(hash){|k,o,n| [o,n].flatten}}
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>4, "d"=>3}
请注意,输出不同。如果一个字母只有一个值,它将作为整数返回,而不是作为1个元素的数组返回。
答案 2 :(得分:1)
我同意Eric Duminil的观点。有趣的数据结构。
array = [{"value"=>[{"a"=>1},{"b"=>4}]},{"value"=>[{"c"=>4},{"d"=>3},{"a"=>3},{"b"=>54}]}]
new_hash = array.inject(Hash.new) do |h,o|
o['value'].each do |sh|
h[sh.keys[0]] = [] if h[sh.keys[0]].nil?
h[sh.keys[0]] << sh.values[0]
end
h
end
puts new_hash
这简直使用 #merge 击败了Eric的答案,但是会做到这一点:
#=> {"a"=>[1, 3], "b"=>[4, 54], "c"=>4, "d"=>3}