基准测试过滤器和分区

时间:2016-07-30 07:16:22

标签: haskell ghc criterion

我正在测试列表的partition函数的性能,并且我认为得到了一些奇怪的结果。

我们有partition p xs == (filter p xs, filter (not . p) xs)但我们选择了第一个实现,因为它只对列表执行单次遍历。然而,我得到的结果表明,使用两次遍历的实现可能会更好。

这是显示我正在看到的内容的最小代码

import Criterion.Main
import System.Random
import Data.List (partition)

mypartition :: (a -> Bool) -> [a] -> ([a],[a])
mypartition p l = (filter p l, filter (not . p) l)



randList :: RandomGen g => g -> Integer -> [Integer]
randList gen 0 = []
randList gen n = x:xs
  where
    (x, gen') = random gen
    xs = randList gen' (n - 1)

main = do
  gen <- getStdGen
  let arg10000000 = randList gen 10000000
  defaultMain [
      bgroup "filters -- split list in half " [
        bench "partition100"         $ nf (partition (>= 50)) arg10000000
      , bench "mypartition100"       $ nf (mypartition (>= 50)) arg10000000
      ]
      ]

我用-O运行测试但没有它,两次都得到双遍历更好。

我将ghc-7.10.3criterion-1.1.1.0

一起使用

我的问题是:

  • 这是预期的吗?

  • 我正确使用Criterion吗?我知道懒惰可能会很棘手,如果使用元组的两个元素,(filter p xs, filter (not . p) xs)只会进行两次遍历。

  • 这是否与Haskell中处理列表的方式有关?

非常感谢!

1 个答案:

答案 0 :(得分:5)

这个问题没有黑色或白色的答案。要剖析问题,请考虑以下代码:

import Control.DeepSeq
import Data.List (partition)
import System.Environment (getArgs)


mypartition :: (a -> Bool) -> [a] -> ([a],[a])
mypartition p l = (filter p l, filter (not . p) l)


main :: IO ()
main = do
  let cnt = 10000000
      xs = take cnt $ concat $ repeat [1 .. 100 :: Int]
  args <- getArgs
  putStrLn $ unwords $ "Args:" : args
  case args of
    [percent, fun]
      -> let p = (read percent >=)
         in case fun of
           "partition"      ->              print $ rnf $ partition   p xs
           "mypartition"    ->              print $ rnf $ mypartition p xs
           "partition-ds"   -> deepseq xs $ print $ rnf $ partition   p xs
           "mypartition-ds" -> deepseq xs $ print $ rnf $ mypartition p xs
           _ -> err
    _ -> err
  where
    err = putStrLn "Sorry, I do not understand."

我不使用Criterion来更好地控制评估顺序。为了获得时间,我使用+RTS -s运行时选项。使用不同的命令行选项执行不同的测试用例。第一个命令行选项定义谓词所包含的数据百分比。第二个命令行选项在不同的测试之间进行选择。

测试区分了两种情况:

  1. 数据是懒惰生成的(第二个参数partitionmypartition)。
  2. 数据已在内存中完全评估(第二个参数partition-dsmypartition-ds)。
  3. 分区的结果始终从左到右进行评估,即从包含谓词所包含的所有元素的列表开始。

    如果情况1 partition的优点是第一个结果列表的元素在输出列表的所有元素被生成之前被丢弃。如果谓词匹配许多元素,即第一个命令行参数很大,则情况1特别好。

    在案例2中,partition无法发挥这一优势,因为所有元素都已存在于内存中。

    对于mypartition,在任何情况下,在评估第一个结果列表之后,所有元素都保存在内存中,因为再次需要它们来计算第二个结果列表。因此,这两种情况没有太大区别。

    看来,使用的内存越多,垃圾收集就越难。因此partition非常适合,如果谓词匹配许多元素并且使用了惰性变体。

    相反,如果谓词与许多元素不匹配或者所有元素已经在内存中,mypartition表现更好,因为与partition相比,它的递归不会处理对。

    Stackoverflow问题“Irrefutable pattern does not leak memory in recursion, but why?”可能会在partition的递归中提供有关处理对的更多见解。