以下简短的Haskell程序用于计算文件中的项目列表。使用foldl'
的版本工作正常,但使用ST Monad
的版本会产生堆栈空间溢出消息。显然这里有一些空间泄漏,但我无法解决它。真正有趣的部分是ST monad
应该进行就地更新,不应该让资源像这样增长,尽管这可能只涉及主内存而不是堆栈空间。有人能解释一下这里发生了什么吗?
import Control.Monad
import Data.List
import Control.Monad.ST
import Data.STRef
--count items using foldl'
countFold :: Num a => [b] -> a
countFold = foldl' (\a _ -> a+1) 0
-- count items using the ST monad
-- derived fromt the sumST example on http://www.haskell.org/haskellwiki/Monad/ST
-- only using +1 instead of adding the values
countST :: Num a => [b] -> a
countST xs = runST $ do
n <- newSTRef 0
forM_ xs ( \_ -> modifySTRef n (+1) )
readSTRef n
main = do
mydata <- readFile "data_files/values_1000000.num"
let trainingdata = lines mydata
-- this works just fine
--(putStrLn (show (countFold trainingdata)))
-- This fails with the message:
-- Stack space overflow: current size 8388608 bytes.
-- Use `+RTS -Ksize -RTS' to increase it.
(putStrLn (show (countST trainingdata)))
更新:感谢您的回答和评论。我想我看到这里发生了什么。 modifySTRef'是版本4.6中的新功能,可以很好地解决问题并包含有人提到的解释。我正在使用Data.STRef的4.5版,它似乎是Ubuntu的标准版,既不包含解释,也不包含modifySTRef'。
查看4.6软件包版本和函数,区别在于它使用seq来确保函数f严格应用(并存储在x'中):
modifySTRef :: STRef s a -> (a -> a) -> ST s ()
modifySTRef ref f = writeSTRef ref . f =<< readSTRef ref
modifySTRef' :: STRef s a -> (a -> a) -> ST s ()
modifySTRef' ref f = do
x <- readSTRef ref
let x' = f x
x' `seq` writeSTRef ref x'
所以解决它的另一种方法是将函数的代码复制到我自己程序空间中的新名称,并将seq应用于泄漏区域,这是一个很好的通用技巧,我将来可能会使用。感谢大家帮我解决这个问题。
答案 0 :(得分:8)