提问人:artella 提问时间:7/28/2014 最后编辑:Communityartella 更新时间:7/28/2014 访问量:361
IO/Monadic 赋值运算符导致 ghci 爆炸为无限列表
IO/Monadic assign operator causing ghci to explode for infinite list
问:
请考虑以下程序。它永远运行,没有任何用处,但ghci中的内存消耗是恒定的:
--NoExplode.hs
module Main (main) where
test :: [Int] -> IO()
test lst = do
print "test"
rList lst
rList :: [Int] -> IO ()
rList [] = return ()
rList (x:xs) = do
rList xs
main = do
test [1..]
现在考虑上述的以下简单修改版本。当这个程序在ghci中运行时,内存会爆炸。唯一的区别是现在在块中分配给 。print "test"
x
do
test
--Explode.hs
module Main (main) where
test :: [Int] -> IO()
test lst = do
x <- print "test"
rList lst
rList :: [Int] -> IO ()
rList [] = return ()
rList (x:xs) = do
rList xs
main = do
test [1..]
为什么改变会导致ghci爆炸?print "test"
x <- print "test"
p.s. 我在试图理解在 ghci 中将惰性字节串写入文件时内存爆炸时遇到了这个问题,那里的问题(我认为)基本上可以提炼到上述内容。谢谢
答:
免责声明:我不是 GHCi 专家,也不擅长 GHC 核心。现在我已经失去了信誉,让我们试着理解会发生什么:
GHCi 和 CAF
GHCi 保留所有已评估的 CAF:
通常,在加载的模块中对顶级表达式(也称为 CAF 或常量应用形式)的任何计算都会在计算之间保留。
现在您可能想知道为什么两个版本之间存在如此大的差异。让我们看一下 .请注意,您可能希望在自己转储程序时删除。-ddump-simpl
-dsuppress-all
程序的转储
非爆炸版本:
❯ ghc SO.hs -ddump-simpl -fforce-recomp -O0 -dsuppress-all
[1 of 1] Compiling Main ( SO.hs, SO.o )
==================== Tidy Core ====================
Result size of Tidy Core = {terms: 29, types: 28, coercions: 0}
$dShow_rq2
$dShow_rq2 = $fShow[] $fShowChar
Rec {
rList_reI
rList_reI =
\ ds_dpU ->
case ds_dpU of _ {
[] -> return $fMonadIO ();
: x_aho xs_ahp -> rList_reI xs_ahp
}
end Rec }
main
main =
>>
$fMonadIO
(print $dShow_rq2 (unpackCString# "test"))
(rList_reI (enumFrom $fEnumInt (I# 1)))
main
main = runMainIO main
重要的部分是 的位置,几乎在最后:[1..]
enumFrom $fEnumInt (I# 1))
如您所见,该列表不是 CAF。但是,如果我们改用爆炸版本会发生什么?
爆炸版本
❯ ghc SO.hs -ddump-simpl -fforce-recomp -O0 -dsuppress-all
[1 of 1] Compiling Main ( SO.hs, SO.o )
==================== Tidy Core ====================
Result size of Tidy Core = {terms: 32, types: 31, coercions: 0}
$dShow_rq3
$dShow_rq3 = $fShow[] $fShowChar
Rec {
rList_reI
rList_reI =
\ ds_dpV ->
case ds_dpV of _ {
[] -> return $fMonadIO ();
: x_ahp xs_ahq -> rList_reI xs_ahq
}
end Rec }
lst_rq4
lst_rq4 = enumFrom $fEnumInt (I# 1)
main
main =
>>=
$fMonadIO
(print $dShow_rq3 (unpackCString# "test"))
(\ _ -> rList_reI lst_rq4)
main
main = runMainIO main
突然出现了一个新的顶级表达式,即 ,它生成列表。如前所述,GHCi 保留了顶级表达式的评估,因此也会保留。lst_rq4
lst_rq4
现在有一个选项可以放弃评估:
启用会导致在每次计算后丢弃所有顶级表达式的计算(在单个计算期间仍会保留它们)。
+r
但是,由于“它们仍然在单次评估期间保留”,在这种情况下甚至对您没有帮助。不幸的是,我无法回答为什么 GHC 引入了一个新的顶级表达式。:set +r
为什么在优化的代码中会发生这种情况?
该列表仍是顶级表达式:
main2
main2 = eftInt 1 2147483647
有趣的是,GHC 实际上并没有创建一个无限列表,因为它是有界的。Int
如何摆脱泄漏?
在这种情况下,如果您将列表置于测试中,则可以将其删除:
test = do
x <- print "test"
rList [1..]
这将阻止 GHC 创建顶级表达式。
但是,我不能就此给出一般性建议。不幸的是,我的 Haskell-fu 还不够好。
评论
[1..]
() -> [Int]
test
评论
ghci +RTS -M100m --RTS …
[1..]
lst_rq4
main
lst_rq4
main
main
main
lst_rq4