在Haskell程序中从堆栈溢出或堆耗尽中恢复

| 我目前正在Haskell中编写一种遗传算法,其中我的染色体是代表可执行系统的相当复杂的结构。 为了评估染色体的适应性,我必须运行“ 0”函数,该函数执行给定系统的一个计算周期。然后,仅通过计算在系统没有任何变化之前(在这种情况下系统终止)可以应用
evolution
的次数来计算适应度。 现在的问题如下:某些系统可以无限期运行,并且永远不会终止-我想对这些系统进行惩罚(给它们很少的分数)。我可以简单地对步数设置一定的限制,但不能解决另一个问题。 我的某些系统执行指数计算(即,即使对于较小的展开步骤,它们也会增长到巨大的大小),并且会导致
ERROR - Control stack overflow
。对于人类观察者来说,很明显他们永远不会终止,但是算法无法得知,因此它会运行并崩溃。 我的问题是:是否可以从此类错误中恢复?我希望我的算法在遇到此问题后能够继续运行,并相应地调整染色体分数。 在我看来,最好的解决方案是告诉程序:“嘿,尝试执行此操作,但是如果失败,请不要担心。我知道如何处理”。但是,我什至不确定这是否可行。如果没有-有其他选择吗?
已邀请:
从Haskell内部很难可靠地做到这一点-尽管在某些情况下,GHC会针对这些情况提出例外情况。 (您将需要GHC 7)。
import Control.Exception
如果您确实只想捕获堆栈溢出,则可以这样做,如以下示例所示:
> handle (\\StackOverflow -> return Nothing) $
              return . Just $! foldr (+) 0 (replicate (2^25) 1) 
Nothing
或捕获任何异步异常(包括堆耗尽):
> handle (\\(e :: AsyncException) -> print e >> return Nothing) $
              return . Just $! foldr (+) 0 (replicate (2^25) 1) 
stack overflow
Nothing
但是,这是脆弱的。 或者,使用GHC标志,您可以在GHC编译的进程上强制使用最大堆栈(或堆)大小,如果超过这些限制,则将其杀死(GHC最近似乎没有最大堆栈限制)。 如果您使用GHC编译Haskell程序(建议),请以以下方式运行它:
$ ghc -O --make A.hs -rtsopts 
强制执行以下低堆限制:
$ ./A +RTS -M1M -K1M
Heap exhausted;
这需要GHC。 (同样,您不应该将拥抱用于此类工作)。最后,您应该通过对GHC进行性能分析,确保程序一开始就不会使用过多的堆栈。
我认为这里的一般解决方案是提供一种测量计算时间的方法,如果花费太多时间,则可以将其终止。您可以简单地将计数器添加到评估函数中(如果它是递归的),如果递减到零,则返回错误值-例如
Nothing
,否则返回
Just result
。 可以通过除显式count参数之外的其他方式来实现此方法,例如,通过将该计数器放入评估所使用的monad中(如果您的代码是monadic),或者不纯洁地在单独的线程中运行计算,这些线程将在超时时终止。 我宁愿使用任何纯解决方案,因为它会更可靠。
It seems to me like the best solution would be to tell the program: 
\"Hey, try doing this, but if you fail don\'t worry. I know how to handle it\"
在大多数语言中,这是
try/catch
块。我不确定haskell中的等效项是什么,即使存在某些等效项也不确定。此外,我怀疑
try/catch
构造能否有效地捕获/处理堆栈溢出条件。 但是,可以应用一些合理的约束来防止溢出发生吗?例如,也许您可​​以在系统的大小上设置一些上限,并监视每个系统如何从一个迭代到下一个迭代接近边界。然后,您可以强制执行\“如果在单个“ 0”上,系统超出其上限或消耗了其先前分配与上限之间剩余的50%以上空间的系统,则该系统将终止并遭受评分罚款\”。
关于遗传算法的想法:染色体适应度的一部分是,它们不会消耗太多的计算资源。您提出的问题将“太多资源”定义为导致运行系统崩溃。这是一个相当随意和有点随机的措施。 知道它将增加your14函数的复杂性后,我仍然建议让此函数了解染色体消耗的计算资源。当它“吃”得过多并且死于“饥饿”时,这使您可以进行微调。它也可以让您根据染色体指数增长的速度来调整惩罚,这种想法是,刚好指数化的染色体比具有极高分支因子的染色体更适合。

要回复问题请先登录注册