如何在Ruby中复制哈希?

时间:2010-11-11 17:37:00

标签: ruby hashmap

我承认我是一个红宝石新手(现在写rake脚本)。在大多数语言中,复制构造函数很容易找到。半小时的搜索没有在红宝石中找到它。我想创建一个哈希的副本,以便我可以修改它而不影响原始实例。

某些预期的方法不能按预期工作:

h0 = {  "John"=>"Adams","Thomas"=>"Jefferson","Johny"=>"Appleseed"}
h1=Hash.new(h0)
h2=h1.to_hash

与此同时,我采用了这种不太优雅的解决方法

def copyhash(inputhash)
  h = Hash.new
  inputhash.each do |pair|
    h.store(pair[0], pair[1])
  end
  return h
end

13 个答案:

答案 0 :(得分:209)

clone方法是Ruby标准的内置方式shallow-copy

irb(main):003:0> h0 = {"John" => "Adams", "Thomas" => "Jefferson"}
=> {"John"=>"Adams", "Thomas"=>"Jefferson"}
irb(main):004:0> h1 = h0.clone
=> {"John"=>"Adams", "Thomas"=>"Jefferson"}
irb(main):005:0> h1["John"] = "Smith"
=> "Smith"
irb(main):006:0> h1
=> {"John"=>"Smith", "Thomas"=>"Jefferson"}
irb(main):007:0> h0
=> {"John"=>"Adams", "Thomas"=>"Jefferson"}

请注意,行为可能会被覆盖:

  

此方法可能具有特定于类的行为。如果是这样,那么该行为将记录在该类的#initialize_copy方法下。

答案 1 :(得分:172)

正如其他人所指出的那样,clone会做到这一点。请注意,哈希的clone会生成浅层副本。也就是说:

h1 = {:a => 'foo'} 
h2 = h1.clone
h1[:a] << 'bar'
p h2                # => {:a=>"foobar"}

正在发生的事情是正在复制哈希的引用,而不是引用引用的对象。

如果你想要深层照片,那么:

def deep_copy(o)
  Marshal.load(Marshal.dump(o))
end

h1 = {:a => 'foo'}
h2 = deep_copy(h1)
h1[:a] << 'bar'
p h2                # => {:a=>"foo"}

deep_copy适用于任何可以编组的对象。大多数内置数据类型(Array,Hash,String和&amp; c。)都可以编组。

编组是Ruby serialization的名称。通过编组,对象 - 它引用的对象 - 被转换为一系列字节;然后,这些字节用于创建另一个对象,如原始对象。

答案 2 :(得分:67)

如果你正在使用Rails,你可以这样做:

h1 = h0.deep_dup

http://apidock.com/rails/Hash/deep_dup

答案 3 :(得分:13)

哈希可以从现有哈希创建一个新哈希:

irb(main):009:0> h1 = {1 => 2}
=> {1=>2}
irb(main):010:0> h2 = Hash[h1]
=> {1=>2}
irb(main):011:0> h1.object_id
=> 2150233660
irb(main):012:0> h2.object_id
=> 2150205060

答案 4 :(得分:5)

我也是Ruby的新手,我在复制哈希方面遇到了类似的问题。使用以下内容。我不知道这种方法的速度。

copy_of_original_hash = Hash.new.merge(original_hash)

答案 5 :(得分:3)

Security Considerations section of Marshal documentation中所述,

  

如果需要反序列化不受信任的数据,请使用JSON或其他   序列化格式,只能加载简单,'原始'   类型,如String,Array,Hash等。

以下是如何在Ruby中使用JSON进行克隆的示例:

require "json"

original = {"John"=>"Adams","Thomas"=>"Jefferson","Johny"=>"Appleseed"}
cloned = JSON.parse(JSON.generate(original))

# Modify original hash
original["John"] << ' Sandler'
p original 
#=> {"John"=>"Adams Sandler", "Thomas"=>"Jefferson", "Johny"=>"Appleseed"}

# cloned remains intact as it was deep copied
p cloned  
#=> {"John"=>"Adams", "Thomas"=>"Jefferson", "Johny"=>"Appleseed"}

答案 6 :(得分:1)

使用Object#clone

h1 = h0.clone

(令人困惑的是,clone的文档说initialize_copy是覆盖此方法的方法,但Hash中该方法的链接会将您引导至replace。 ..)

答案 7 :(得分:1)

您可以使用以下内容深度复制哈希对象。

deeply_copied_hash = Marshal.load(Marshal.dump(original_hash))

答案 8 :(得分:1)

由于标准克隆方法保留了冻结状态,因此如果您希望新对象与原始对象略有不同(如果您喜欢无状态编程),则它不适合基于原始对象创建新的不可变对象。

答案 9 :(得分:1)

克隆很慢。对于性能应该从空白哈希和合并开始。不包括嵌套哈希的情况......

require 'benchmark'

def bench  Benchmark.bm do |b|    
    test = {'a' => 1, 'b' => 2, 'c' => 3, 4 => 'd'}
    b.report 'clone' do
      1_000_000.times do |i|
        h = test.clone
        h['new'] = 5
      end
    end
    b.report 'merge' do
      1_000_000.times do |i|
        h = {}
        h['new'] = 5
        h.merge! test
      end
    end
    b.report 'inject' do
      1_000_000.times do |i|
        h = test.inject({}) do |n, (k, v)|
          n[k] = v;
          n
        end
        h['new'] = 5
      end
    end
  end
end

  bench  user      system      total        ( real)
  clone  1.960000   0.080000    2.040000    (  2.029604)
  merge  1.690000   0.080000    1.770000    (  1.767828)
  inject 3.120000   0.030000    3.150000    (  3.152627)
  

答案 10 :(得分:0)

这是一种特殊情况,但是如果您要从预先获取的哈希值开始并获取副本,则可以创建一个返回哈希的方法:

def johns 
    {  "John"=>"Adams","Thomas"=>"Jefferson","Johny"=>"Appleseed"}
end

h1 = johns

我遇到的特殊情况是我有一些JSON模式哈希的集合,其中一些哈希构建了其他哈希。我最初将它们定义为类变量并遇到了这个副本问题。

答案 11 :(得分:0)

由于Ruby有一百万种方法可以做到这一点,这是使用Enumerable的另一种方式:

h0 = {  "John"=>"Adams","Thomas"=>"Jefferson","Johny"=>"Appleseed"}
h1 = h0.inject({}) do |new, (name, value)| 
    new[name] = value;
    new 
end

答案 12 :(得分:-2)

对我有用的Deep_Copy的替代方法。

h1 = {:a => 'foo'} 
h2 = Hash[h1.to_a]

这产生了一个deep_copy,因为h2是使用h1而不是h1的引用的数组表示形成的。