在Ruby Array中删除重复项(按键)的最快/一线方法?

时间:2009-10-19 20:29:03

标签: ruby arrays duplicates

基于特定键:值或方法返回的结果,删除对象数组中重复项的最快/单行方法是什么?

例如,我有20个XML Element节点,这些节点都是相同的名称,但是它们具有不同的“文本”值,其中一些是重复的。我想通过说“if element.text == previous_element.text,删除它”删除重复项。我如何用最短的代码在Ruby中做到这一点?

我已经看过如何对简单的字符串/整数值进行操作,但对于对象则没有。

3 个答案:

答案 0 :(得分:14)

这是标准的哈希方式。请注意使用||=运算符,这是一种更方便(a ||= b)的方式来编写a = b unless a

array.inject({}) do |hash,item|
   hash[item.text]||=item
   hash 
end.values.inspect

您也可以在一行中完成。

脚本需要对text字符串进行O(n)等式检查。当你看到哈希时,这就是O(n)所涵盖的内容。

答案 1 :(得分:10)

这就是全部:

Hash[*a.map{|x| [x.text, x]}].values

<强>短?是的。

(星号是可选的;似乎是1.8.6所必需的。)

例如:

a = [Thing.new('a'), Thing.new('b'), Thing.new('c'), Thing.new('c')]
=> [#<Thing a>, #<Thing b>, #<Thing c>, #<Thing c>]

Hash[a.map{|x| [x.text, x]}].values
=> [#<Thing a>, #<Thing b>, #<Thing c>]

无聊的部分:这是我使用的小测试类:

class Thing
  attr_reader :text
  def initialize(text)
    @text = text
  end

  def inspect
    "#<Thing #{text}>"
  end
end

答案 2 :(得分:4)

Array#uniq与块一起使用。在你的情况下:

array.uniq(&:text) # => array with duplicated `text` removed

这是在Ruby 1.9.2中引入的,因此如果使用早期版本,您可以将backportsrequire 'backports/1.9.2/array/uniq'

一起使用