我应该如何避免无意中捕获函数文字中的局部范围?
我会用Scala示例来问这个问题,但很可能这会影响其他允许混合命令和函数样式的语言。
这是一个简短的例子(更新,见下文):
def method: Iterator[Int] {
// construct some large intermediate value
val huge = (1 to 1000000).toList
val small = List.fill(5)(scala.util.Random.nextInt)
// accidentally use huge in a literal
small.iterator filterNot ( huge contains _ )
}
现在iterator.filterNot
懒散地工作,这很棒!因此,我们希望返回的迭代器不会消耗太多内存(实际上是O(1))。然而,遗憾的是,我们犯了一个可怕的错误:因为filterNot
是懒惰的,所以它保留了函数文字huge contains _
的引用。
因此,虽然我们认为该方法在运行时需要大量内存,并且该方法可以在方法终止后立即释放,但实际上内存会被卡住,直到我们忘记返回的Iterator
。
(我只是犯了这样一个错误,这需要花费很长时间才能找到!你可以抓住这些东西看堆堆...)
避免此问题的最佳做法是什么?
似乎唯一的解决方案是仔细检查在范围结束时存活的函数文字,以及捕获的中间变量。如果您构建一个非严格的集合并计划返回它,这有点尴尬。任何人都可以想到一些不错的技巧,特定于Scala或其他方式,避免这个问题,让我写出漂亮的代码?
更新:我之前给出的例子是愚蠢的,正如huynhjl的答案所示。它曾经是:
def method: Iterator[Int] {
val huge = (1 to 1000000).toList // construct some large intermediate value
val n = huge.last // do some calculation based on it
(1 to n).iterator map (_ + 1) // return some small value
}
事实上,现在我对这些事情的运作方式有所了解,我并不那么担心!
没有找到相关结果
已邀请:
1 个回复
粟痢凰副
如果我理解正确,因为即使在
调用之后
也在使用迭代器,JVM将保留在
对象上。 这是我运行它的方式:
这是它打印到最后:
所以它看起来好像
对象被回收了......