假设我在几个开放式交互式导轨控制台中运行了一个很长的工作脚本。
该脚本正在更新非常非常大的记录表中的列。我已经将ActiveRecord记录器静音以加速该过程,并指示脚本输出一些进度记录,以便我知道该过程将花费多长时间。这就是我目前正在做的事情,看起来像这样:
ModelName.all.each_with_index do |r, i|
puts i if i % 250
...runs some process...
r.save
end
有时它的两个嵌套数组会运行,这样就会有多个迭代器和其他东西同时运行。
有没有办法可以做这样的事情并从单独的rails控制台访问该变量? (这样每次运行过程都会覆盖变量,而不会太慢)
records = ModelName.all
$total = records.count
records.each_with_index do |r, i|
$i = i
...runs some process...
r.save
end
同时在其他控制台中间处理
puts "#{($i/$total * 100).round(2)}% complete"
#=> 67.43% complete
我知道将全局变量从一个单独的ruby实例传递给下一个实例并不起作用。我也试过这个也没效果
unix console 1
$X=5
echo {$X}
#=> 5
unix console 2
echo {$X}
#=> ""
最后,我也知道使用像这样的全局变量是一个主要的软件设计模式禁忌。我认为这是合理的,但如果我愿意,我仍然想知道如何打破这条规则。
写入文本文件显然会起作用。那么写入单独的数据库表或其他东西。这不是一个坏主意。但真正酷的技巧是在两个实例之间共享变量而无需写入文本文件或数据库列。
无论如何,这会被称为什么?隧道?我不太清楚如何标记这个问题。也许坏主意就是其中之一。但老实说,设计模式并不是这个问题的关键所在。
这是我设置的快速实现,似乎有效:
系统通常需要三个单独的类(在我的例子中,我使用所有类,因为我在轨道中并且更容易)
计数器类:将其传递给DRb,然后可以通过客户端访问其所有方法。因此,这个对象可能非常复杂。
class Counter
attr_accessor :i
def initialize
@i = 0
end
def report(total)
"#{(@i.to_f / total.to_f * 100).round(2)}%"
end
end
柜台服务器。计数器被传递到这个。在我的情况下,进程挂起,因此不返回任何内容,无法访问。我还没想出如何将它作为一个可以通过对象访问的守护进程运行,所以最好传入uri并控制它,这样就不需要返回任何内容了。对此有好处的是你可以让它运行很长时间并通过attr_accessor调用的访问器方法重写可访问的变量。 Ruby让它非常简单。
require 'drb'
class CounterServer
def initialize(uri="druby://:9000")
DRb.start_service(uri, Counter.new)
puts "server running on #{DRb.uri}"
trap("INT") {DRb.stop_service}
DRb.thread.join
end
end
客户。允许您访问服务器。
require 'drb'
class CounterClient
attr_reader :client, :total
def initialize(uri="druby://:9000", records)
@client = DRbObject.new nil, uri
@total = records.count
end
def incremement
@client.i += 1
end
def monitor_and_report
values = []
puts "you must first set the @total value! This should be done in the ruby script being monitored by passing in the records as a first variable for initialize" if @client.total.nil?
5/0 if @client.total.nil?
while ((@client.i) < (@client.total))
values << pctg_complete
puts "#{pctg_complete}%"
last_index = (values.count - 1)
percentage_per_second = get_slope(values[last_index], values[last_index - 1])
puts get_eta(percentage_per_second, values[last_index]) unless values.count == 1
sleep 10
end
end
def get_slope(latest, second_latest)
run = 10.0# seconds
rise = (latest - second_latest)
slope = (rise/run)
slope
end
def get_eta(velocity, current)
puts "velocity: #{velocity}"
puts "current: #{current}"
pctg_left_to_complete = (100.0 - current)
puts "pctg_left: #{pctg_left_to_complete}"
estimated_seconds_remaining = pctg_left_to_complete / velocity
minutes_left = (estimated_seconds_remaining / 60.0).round(0)
"estimated #{minutes_left} minutes until completion"
end
所以,在我的问题的例子中:
console 1
CounterServer.new
#=> hangs while server runs
console(ruby script)2
records = ModelName.all
c = CounterClient.new(nil, records)
records.each_with_index do |r, i|
c.increment
...runs code...
r.save
end
console 3
c = CounterClient.new
c.monitor_and_report
请注意几周后再次查看此内容: 这段代码可以简单得多。例如,Counter类不需要报告任何内容。它需要的只是attr_accessor方法。服务器&amp;客户端也可以被剥离到只有几行。
然而,这里的脚本有一个主题元素。自从我写这篇文章以来,我还没有使用它,但学习如何在不同的红宝石游戏机之间进行通信似乎是一种非常强大的技能。
更新 这款手表的“小功能”不是有效。即eta功能。这是一块****
答案 0 :(得分:3)
你需要Drb。它的工作原理是创建一个分布式ruby服务(服务器),然后客户端连接到它并能够从中获取Ruby对象。
http://www.ruby-doc.org/stdlib-1.9.3/libdoc/drb/rdoc/DRb.html
答案 1 :(得分:0)
ruby在unix通道上发出数据,如STDERR或STDOUT。然后管道输出到另一个基于ruby的接收器。
这个辅助过程除了空闲之外什么都不做,检查它的STDIN数据 - 找到任何一个,它会打印到屏幕上。
您还可以让长时间运行的脚本通过发出数据when it traps a given signal来执行此操作。因此,记录操作仅在您发出信号时发生。
memcached_client = get_memcashed_singleton
begin
if record_count % 250 == 0
Signal.trap("USR1") do
memcached_client.store('lrp1_percent_done', batch_position )
end
Signal.trap("TERM") do
puts "Terminating..."
stop_processing_at_next_logical_block
end
end
# . . . do some work . . .
while records_left_in_giant_processing_table?
总的来说,从技术上讲,一个更好的架构策略是,长时间运行的进程打开客户端连接到memcached,以便为网络中的另一个预先存在的服务 - 并将日志数据写入其中。
您唯一需要付出的代价就是连接的内存,以及与基于内存的服务器通信的极短时间。
您必须考虑编写一条信息意味着什么,以便另一个进程可以读取它,以及执行该操作需要多长时间。校长和说话,您要么写入磁盘,要么写入已注册的内存。
磁盘上的文件类似于套接字。
内存中的寄存器类似于报告