Ruby / EventMachine数据包解析器

时间:2012-04-05 18:47:36

标签: ruby eventmachine

我正在尝试编写一个可以打包/解压缩结构化二进制数据包的自定义EM :: Protocol模块。数据包结构应定义为名称/格式对,可以是字符串,其他一些易于解析的格式,也可以是某种DSL。

一些快速的代码来实现这个想法:

module PacketProtocol
    def self.included(base)
        base.extend ClassMethods
    end

    def receive_data(data)
        # retrieve packet header
        # find matching packet definition
        # packet.unpack(data)
    end

    module ClassMethods
        def packet(defn)
            # create an instance of Packet (see blow) and shove it
            # somewhere i can get to later.
        end
    end
end

module MyHandler
    include PacketProtocol
    packet '<id:S><len:S><msg:A%{len}>'
end

EM.run do
     EM.start_server '0.0.0.0', 8080, MyHandler
end

我的目标是最小化运行时复杂性。数据包定义是每次执行都是静态的,所以我想避免这种(粗略的)实现:

class Packet
    FmtSize = {
        'S' => 2, 
        'A' => Proc.new {|fmt| fmt[1..-1].to_i }
    }

    def initialize(defn)
        @fields = defn.scan(/<([^>]+):([^>]+)>/)
    end

    def pack(data)
        data.values.pack @fields.map { |name, fmt| fmt % data }.join
    end

    def unpack(defn)
        data = {}
        posn = 0
        @fields.each do |name, len|
            fmt = len % data
            len = FmtSizes[fmt[0]]
            len = len.call(fmt) if len.class == Proc
            data[name.to_sym] = bytes[posn..posn + len - 1].unpack(fmt)[0]
            posn += len
        end
        data
    end
end

data = { :id => 1, :len => 5, :msg = 'Hello' }
packet = Packet.new '<id:S><len:S><msg:A%{len}>'
packed = packet.pack(data)

require 'benchmark'

Benchmark.bm(7) do |x|
    x.report('slow') {
        100000.times do
            unpacked = packet.unpack(packed)
        end
    }
    x.report('fast') {
        100000.times do
            data = {}
            data[:id] = packed[0..1].unpack('S' % data)
            data[:len] = packed[2..3].unpack('S' % data)
            data[:msg] = packed[4..8].unpack('A%{len}' % data)
        end
    }
end

# output:
#              user     system      total        real
# slow     1.970000   0.000000   1.970000 (  1.965525)
# fast     0.140000   0.000000   0.140000 (  0.146227)

在这两个例子中,使用Packet类似乎要慢几个。

SO。问题是:

是否有一种方法(或gem)允许您在运行时生成代码(除了简单地评估字符串)?

修改

刚刚找到BinData。虽然它的功能设置很好,但它的基准测试速度也慢得多。

0 个答案:

没有答案