与Ruby中重复元素的数组交集

时间:2012-06-15 16:11:45

标签: ruby arrays

我想(快速)确定一个数组是否包含另一个数组的所有元素,同时考虑到数组可能有重复的元素。

因此,我试过这样的事情:

alice = %w(a a a b)
bob = %w(a a b c d e)
alice & bob => ["a", "b"]
alice - bob => []

但我想要的是一个运算符,让我确定bob不包含alice的所有元素,因为bob没有足够的“a”字符。

4 个答案:

答案 0 :(得分:3)

可能最容易计算每个元素出现的频率,因此我们不必过于担心跟踪我们已经/不计算的重复项:

alice_counts = alice.each_with_object(Hash.new(0)) { |o, h| h[o] += 1 }
#=> {"a"=>3, "b"=>1}

bob_counts = bob.each_with_object(Hash.new(0)) { |o, h| h[o] += 1 }
#=> {"a"=>2, "b"=>1, "c"=>1, "d"=>1, "e"=>1}

然后检查alice_countsbob_counts中的每个键的值是否等于或大于alice_counts.all? { |k, v| bob_counts[k] >= v } #=> false

{{1}}

答案 1 :(得分:3)

alice.select{|x| alice.count(x) > bob.count(x)}

<强>更新 建立基准:

require 'benchmark'

def subset_multivalue?(a, b)
  bb = b.clone
  a.each do |e|
    i = bb.index(e)
    if i
      bb.delete_at(i)
    else
      return false
    end
  end
  return true
end

def subset_multivalue2?(a, b)
  a.find{|x| a.count(x) > b.count(x)}
end

def subset_multivalue3?(alice, bob)
  alice_counts = alice.each_with_object(Hash.new(0)) { |o, h| h[o] += 1 }
  bob_counts = bob.each_with_object(Hash.new(0)) { |o, h| h[o] += 1 }

  alice_counts.all? do |k, v|
    bob_counts.has_key?(k) && bob_counts[k] >= v
  end
end

alice = %w(a a a b)
bob = %w(a a b c d e)

Benchmark.bm do |x|
  x.report("dave:") do
    1000000.times do
      subset_multivalue?(alice, bob)
    end
  end

  x.report("me:") do
    1000000.times do
      subset_multivalue2?(alice,bob)
    end
  end

  x.report("andrew:") do
    1000000.times do
      subset_multivalue3?(alice,bob)
    end
  end
end

结果:

       user     system      total        real
dave: 15.054000   0.000000  15.054000 ( 15.108864)
me: 11.529000   0.031000  11.560000 ( 11.689669)
andrew: 65.036000   0.047000  65.083000 ( 67.463859)

答案 2 :(得分:0)

我想我已经解决了这个问题:

def subset_multivalue?(a, b)
    bb = b.clone
    a.each do |e|
            i = bb.index(e)
            if i
                    bb.delete_at(i)
            else
                    return false
            end
    end
    return true
end

我意识到它不是很红宝石,但它似乎可以完成这项工作。

答案 3 :(得分:0)

可以选择数组#group_by()。

alice = %w(a a a b)
bob = %w(a a b c d e)
alice_group = alice.group_by{|a| a}.map{|k,v| [k ,v.length]}
#=> [["a", 3], ["b", 1]]
bob_group = bob.group_by{|a| a}.map{|k,v| [k ,v.length]}
#=> [["a", 2], ["b", 1], ["c", 1], ["d", 1], ["e", 1]]
alice_group-bob_group
#=> [["a", 3]]
bob_group-alice_group
#=>[["a", 2], ["c", 1], ["d", 1], ["e", 1]]