Lua挑战:你能改进那种实施的性能吗?

时间:2009-02-20 16:38:18

标签: optimization lua

Lua目前是最快的脚本语言,对于某些类型的程序而言,它的速度并不比C / C ++慢(与1:1的pidgits相当),但Lua在针对C的一些基准测试中得分非常糟糕/ C ++。

其中一个是fannkuch测试(索引访问微小的整数序列),它得分可怕的1:148

-- The Computer Language Benchmarks Game
-- http://shootout.alioth.debian.org/
-- contributed by Mike Pall

local function fannkuch(n)
  local p, q, s, odd, check, maxflips = {}, {}, {}, true, 0, 0
  for i=1,n do p[i] = i; q[i] = i; s[i] = i end
  repeat
    -- Print max. 30 permutations.
    if check < 30 then
      if not p[n] then return maxflips end  -- Catch n = 0, 1, 2.
      io.write(unpack(p)); io.write("\n")
      check = check + 1
    end
    -- Copy and flip.
    local q1 = p[1]             -- Cache 1st element.
    if p[n] ~= n and q1 ~= 1 then       -- Avoid useless work.
      for i=2,n do q[i] = p[i] end      -- Work on a copy.
      for flips=1,1000000 do            -- Flip ...
    local qq = q[q1]
    if qq == 1 then             -- ... until 1st element is 1.
      if flips > maxflips then maxflips = flips end -- New maximum?
      break
    end
    q[q1] = q1
    if q1 >= 4 then
      local i, j = 2, q1 - 1
      repeat q[i], q[j] = q[j], q[i]; i = i + 1; j = j - 1; until i >= j
    end
    q1 = qq
      end
    end
    -- Permute.
    if odd then
      p[2], p[1] = p[1], p[2]; odd = false  -- Rotate 1<-2.
    else
      p[2], p[3] = p[3], p[2]; odd = true   -- Rotate 1<-2 and 1<-2<-3.
      for i=3,n do
    local sx = s[i]
    if sx ~= 1 then s[i] = sx-1; break end
    if i == n then return maxflips end  -- Out of permutations.
    s[i] = i
    -- Rotate 1<-...<-i+1.
    local t = p[1]; for j=1,i do p[j] = p[j+1] end; p[i+1] = t
      end
    end
  until false
end

local n = tonumber(arg and arg[1]) or 1
io.write("Pfannkuchen(", n, ") = ", fannkuch(n), "\n")

那么如何对其进行优化(当然,与任何优化一样,您必须测量实施以确保更快)。并且你不允许为此改变Lua的C核心,或者使用LuaJit,它可以找到优化Lua弱点之一的方法。

1 个答案:

答案 0 :(得分:4)

罗伯特古尔德&gt; 其中一个是fannkuch测试(索引访问微小的整数序列),它得分可怕的1:148

当你引用基准游戏中的数字时,请显示这些数字的来源,以便读者有一些背景。

在这种情况下,您似乎已经在四核计算机上测量了数字,其中最快的程序已被重写以利用多个核心。而不是查看经过的时间sort by CPU time and you'll see the ratio drop to 1:43

或者查看中位数和四分位数以获得对how the set of C++ measurements compares to the set of Lua measurements的更好印象。

或者有一整套测量,程序被迫只使用一个核心 - Lua compared with C++ - 如果你看一下those Lua pi-digits programs,你会发现他们使用的是C语言GNU GMP库。