在不同的ruby实例之间传递变量(无需写入文本文件或数据库)

时间:2013-10-12 20:21:22

标签: ruby global-variables ipc

假设我在几个开放式交互式导轨控制台中运行了一个很长的工作脚本。

该脚本正在更新非常非常大的记录表中​​的列。我已经将ActiveRecord记录器静音以加速该过程,并指示脚本输出一些进度记录,以便我知道该过程将花费多长时间。这就是我目前正在做的事情,看起来像这样:

ModelName.all.each_with_index do |r, i|
  puts i if i % 250
  ...runs some process...
  r.save
end

有时它的两个嵌套数组会运行,这样就会有多个迭代器和其他东西同时运行。

有没有办法可以做这样的事情并从单独的rails控制台访问该变量? (这样每次运行过程都会覆盖变量,而不会太慢)

records = ModelName.all
$total = records.count
records.each_with_index do |r, i|
  $i = i
  ...runs some process...
  r.save
end

同时在其他控制台中间处理

puts "#{($i/$total * 100).round(2)}% complete"
#=> 67.43% complete

我知道将全局变量从一个单独的ruby实例传递给下一个实例并不起作用。我也试过这个也没效果

unix console 1

 $X=5
 echo {$X}
 #=> 5

unix console 2

echo {$X}
#=> ""

最后,我也知道使用像这样的全局变量是一个主要的软件设计模式禁忌。我认为这是合理的,但如果我愿意,我仍然想知道如何打破这条规则。

写入文本文件显然会起作用。那么写入单独的数据库表或其他东西。这不是一个坏主意。但真正酷的技巧是在两个实例之间共享变量而无需写入文本文件或数据库列。

无论如何,这会被称为什么?隧道?我不太清楚如何标记这个问题。也许坏主意就是其中之一。但老实说,设计模式并不是这个问题的关键所在。

我使用答案解决了一些解决方案:

这是我设置的快速实现,似乎有效:

系统通常需要三个单独的类(在我的例子中,我使用所有类,因为我在轨道中并且更容易)

计数器类:将其传递给DRb,然后可以通过客户端访问其所有方法。因此,这个对象可能非常复杂。

class Counter
  attr_accessor :i
  def initialize
    @i = 0
  end
  def report(total)
    "#{(@i.to_f / total.to_f * 100).round(2)}%"
  end
end    

柜台服务器。计数器被传递到这个。在我的情况下,进程挂起,因此不返回任何内容,无法访问。我还没想出如何将它作为一个可以通过对象访问的守护进程运行,所以最好传入uri并控制它,这样就不需要返回任何内容了。对此有好处的是你可以让它运行很长时间并通过attr_accessor调用的访问器方法重写可访问的变量。 Ruby让它非常简单。

require 'drb'
class CounterServer
  def initialize(uri="druby://:9000")
    DRb.start_service(uri, Counter.new)
    puts "server running on #{DRb.uri}"
    trap("INT") {DRb.stop_service}
    DRb.thread.join
  end
end

客户。允许您访问服务器。

require 'drb'
class CounterClient
  attr_reader :client, :total
  def initialize(uri="druby://:9000", records)
    @client = DRbObject.new nil, uri
    @total = records.count
  end
  def incremement
    @client.i += 1
  end
  def monitor_and_report
    values = []
    puts "you must first set the @total value! This should be done in the ruby script being monitored by passing in the records as a first variable for initialize" if @client.total.nil?
    5/0 if @client.total.nil?
    while ((@client.i) < (@client.total))
      values << pctg_complete
      puts "#{pctg_complete}%"
      last_index = (values.count - 1)
      percentage_per_second = get_slope(values[last_index], values[last_index - 1])
      puts get_eta(percentage_per_second, values[last_index]) unless values.count == 1
      sleep 10
    end
  end

  def get_slope(latest, second_latest)
    run  = 10.0# seconds
    rise = (latest - second_latest)
    slope = (rise/run)
    slope
  end

  def get_eta(velocity, current)
    puts "velocity: #{velocity}"
    puts "current: #{current}"
    pctg_left_to_complete = (100.0 - current)
    puts "pctg_left: #{pctg_left_to_complete}"
    estimated_seconds_remaining = pctg_left_to_complete / velocity
    minutes_left = (estimated_seconds_remaining / 60.0).round(0)
    "estimated #{minutes_left} minutes until completion"
  end

所以,在我的问题的例子中:

console 1

CounterServer.new
#=> hangs while server runs

console(ruby script)2

records = ModelName.all
c = CounterClient.new(nil, records)
records.each_with_index do |r, i|
  c.increment
  ...runs code...
  r.save
 end

console 3

c = CounterClient.new
c.monitor_and_report

请注意几周后再次查看此内容: 这段代码可以简单得多。例如,Counter类不需要报告任何内容。它需要的只是attr_accessor方法。服务器&amp;客户端也可以被剥离到只有几行。

然而,这里的脚本有一个主题元素。自从我写这篇文章以来,我还没有使用它,但学习如何在不同的红宝石游戏机之间进行通信似乎是一种非常强大的技能。

更新 这款手表的“小功能”不是有效。即eta功能。这是一块****

2 个答案:

答案 0 :(得分:3)

你需要Drb。它的工作原理是创建一个分布式ruby服务(服务器),然后客户端连接到它并能够从中获取Ruby对象。

http://www.ruby-doc.org/stdlib-1.9.3/libdoc/drb/rdoc/DRb.html

答案 1 :(得分:0)

ruby​​在unix通道上发出数据,如STDERR或STDOUT。然后管道输出到另一个基于ruby的接收器。

这个辅助过程除了空闲之外什么都不做,检查它的STDIN数据 - 找到任何一个,它会打印到屏幕上。

您还可以让长时间运行的脚本通过发出数据when it traps a given signal来执行此操作。因此,记录操作仅在您发出信号时发生。

memcached_client = get_memcashed_singleton

begin
  if record_count % 250 == 0
    Signal.trap("USR1") do
      memcached_client.store('lrp1_percent_done', batch_position )
    end
    Signal.trap("TERM") do
      puts "Terminating..."
      stop_processing_at_next_logical_block
    end
  end
  # . . . do some work . . .
while records_left_in_giant_processing_table?

总的来说,从技术上讲,一个更好的架构策略是,长时间运行的进程打开客户端连接到memcached,以便为网络中的另一个预先存在的服务 - 并将日志数据写入其中。

您唯一需要付出的代价就是连接的内存,以及与基于内存的服务器通信的极短时间。


您必须考虑编写一条信息意味着什么,以便另一个进程可以读取它,以及执行该操作需要多长时间。校长和说话,您要么写入磁盘,要么写入已注册的内存。

磁盘上的文件类似于套接字。

内存中的寄存器类似于报告