如何找到不同Haskell函数的复杂度(就big-O而言)?
例如,subsequences
的复杂性是什么?
答案 0 :(得分:23)
您只能通过查看代码来计算函数的确切复杂性。但是,您可以使用criterion估算它。
例如,以下程序将subsequence
的复杂性估计为列表长度的函数。
module Main where
import Criterion (bench, nf)
import Criterion.Main (defaultMain)
import Data.List (subsequences)
import Control.DeepSeq (deepseq)
main = defaultMain (map createBenchmark [0, 2 .. 24])
where
createBenchmark n =
let
xs = replicate n 'x'
in
xs `deepseq` (bench (show n) $ nf subsequences xs)
如果您编译它(使用-O2
!)并使用
./Main -u report
(或
./Main --csv report
在较新版本的标准中)
您将获得包含数据的CSV文件(每次运行的平均时间,差异和其他信息)。
如果您绘制该数据,您将意识到它在n
中是指数式的,如下面的gnuplot会话所示。
> f(x) = a * exp(b * x)
> fit f(x) 'report' using ($0 * 2):2 every ::2 via a,b
...
Final set of parameters Asymptotic Standard Error
======================= ==========================
a = 1.7153e-07 +/- 5.441e-09 (3.172%)
b = 0.711104 +/- 0.001438 (0.2023%)
correlation matrix of the fit parameters:
a b
a 1.000
b -1.000 1.000
> set log y
> set xlabel 'n'
> set ylabel 'mean time [s]'
> plot 'report' using ($0 * 2):2 every ::2 with lp title 'data', f(x) title 'fit'
a
大约为零,b
几乎没有错误。因此,非常确定的是,复杂度为O(2 ^ n),因为e ^ 0.71几乎正好是2.
当然,这种技术假定您实际上正在使用函数返回的所有内容。如果您只访问返回列表的第一个元素,由于延迟评估,复杂性将为O(1)。
你可能会找到一种方法使这个程序独立于基准测试功能(至少对于只列出一个列表的函数)。还有一些不错的Haskell库用于绘制数据,因此您不需要依赖外部程序(不幸的是,作为一名科学家,我从未使用过任何东西,只有gnuplot)。