我试图比较Haskell列表和数组的性能并遇到一种奇怪的行为。 我观察到,如果我创建一个数组然后打印它需要'x'MB的内存,但如果我使用'elems'函数将数组转换为一个列表然后打印它需要小于'x'的内存。 是不是'elems'函数应该从数组中创建一个新列表?它不应该占用比不创建列表的功能更多的空间吗? 我正在使用-O2和-fspec-constr优化标志。我也使用-p标志来分析函数。
这是没有中间列表的代码,
fun n = runST $ do
final_soln <- newArray_ ((1,1), (n, (10 ^ n))) :: ST s ((STUArray s) (Int,Int) Int)
U.unsafeFreeze final_soln
main = do
[n] <- getArgs
{-# SCC "file-writing" #-} (writeFile "cprod-starray-creation.txt" $ show $ fun (read n))
这是包含中间列表的代码
fun :: Int -> UArray (Int,Int) Int
fun n = runST $ do
final_soln <- newArray_ ((1,1), (n, (10 ^ n))) :: ST s ((STUArray s) (Int,Int) Int)
U.unsafeFreeze final_soln
main = do
[n] <- getArgs
{-# SCC "file-writing" #-} (writeFile "cprod-starray-creation.txt" $ show $ elems $ fun (read n))
提前致谢
答案 0 :(得分:16)
第一个变种中缺乏懒惰,这不是你的错。将运行的分析输出(+RTS -hd
)与参数6进行比较,得出第一个提示:
是第一个代码的分析输出,而
是第二个代码的结果。数组本身(ARR_WORDS
)在两者中占用相同的空间。您还会看到第一个代码生成:
构造函数的大型列表(Int
构造函数可识别)(恰好有Int#
}。
现在这不能是打印的最终字符串,因为那将是Char
s(使用构造函数C#
)。它也可以不是数组中的元素列表,因为数组包含零,垃圾收集器有一个小Int
的缓存(在[-16,16]范围内),它将使用而不是分配(或实际上不是复制)新的构造函数。
另请注意,:
构造函数大约需要24MB,I#
构造函数大约需要16MB。知道前者需要3个单词而后两个单词,并且我机器上的一个单词长8个字节,我们发现列表长度为100000 = 10 ^ 6个元素。因此,非常好的候选者是第二个索引参数的范围。
那么这个阵列在哪里?让我们跟踪您对show
:
showsIArray :: (IArray a e, Ix i, Show i, Show e) => Int -> a i e -> ShowS
showsIArray p a =
showParen (p > 9) $
showString "array " .
shows (bounds a) .
showChar ' ' .
shows (assocs a)
(来自Data.Array.Base的代码)。很明显,罪魁祸首必须在assocs
电话中,所以这里有来源:
assocs :: (IArray a e, Ix i) => a i e -> [(i, e)]
assocs arr = case bounds arr of
(l,u) -> [(i, arr ! i) | i <- range (l,u)]
由于我们正在寻找索引列表,range
调用看起来很可疑。为此,我们必须研究GHC.Arr的来源(不幸的是,它已经搞砸了):
instance (Ix a, Ix b) => Ix (a, b) where
range ((l1,l2),(u1,u2)) = [ (i1,i2) | i1 <- range (l1,u1), i2 <- range (l2,u2) ]
现在我们找到了罪魁祸首:在此处,range (l2,u2)
将为索引的第一个组件中的每个步骤评估列表[1..1000000]
和共享。
现在我猜你会好奇地试图在第二个代码中放置assocs
而不是elems
,并期待那里的空间泄漏。但你不会看到它。原因是show
没有内联,但assocs
本身被内联,然后还有一大堆其他函数,包括range
有效避免共享。你可以通过将-ddump-rule-firings
传递给GHC来看到(某种程度上):
$ ghc --make -O2 -fspec-constr -ddump-rule-firings -fforce-recomp code2.hs -prof -fprof-auto
[1 of 1] Compiling Main ( code2.hs, code2.o )
Rule fired: SPEC GHC.Arr.$fIx(,)
Rule fired: unpack
Rule fired: Class op fail
Rule fired: unpack
Rule fired: Class op show
Rule fired: Class op newArray_
Rule fired: unsafeFreeze/STUArray
Rule fired: Class op >>=
Rule fired: Class op >>=
Rule fired: Class op showList
Rule fired: Class op rangeSize
Rule fired: Class op rangeSize
Rule fired: Class op bounds
Rule fired: Class op bounds
Rule fired: Class op numElements
Rule fired: Class op index
Rule fired: Class op unsafeAt
Rule fired: Class op range
Rule fired: fold/build
Rule fired: SPEC GHC.Real.^
Rule fired: unpack-list
Rule fired: foldr/app
Rule fired: unpack-append
Rule fired: foldr/app
Rule fired: unpack-append
Rule fired: >#
Rule fired: >#
Rule fired: x# <=# x#
Rule fired: x# -# x#
Rule fired: 0# *# x#
Rule fired: 0# +# x#
Linking code2 ...