此问题在项目中被发现,经查看JDK源码(JDK1.6),String类的public String substring(int beginIndex, int endIndex)的实现让我很意外。
想重现这个场景很容易,请看代码。
1
import java.util.ArrayList;
2
import java.util.List;
3
4
public class LeakTest
{
5
public static void main(String
args)
{
6
List<String> handler = new ArrayList<String>();
7
for(int i = 0; i < 100000; i++)
{
8
Huge h = new Huge();
9
handler.add(h.getSubString(1, 5));
10
}
11
}
12
}
13
14
class Huge
{
15
private String str = new String(new char[100000]);
16
public String getSubString(int begin, int end)
{
17
return str.substring(begin, end);
18
}
19
}
执行此代码结果:
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
问题就出在Huge类的 getSubString 方法,它调用了String类的substring方法。
来让我们看看 substring 类的实现吧,JDK源码如下:
1
public String substring(int beginIndex, int endIndex)
{
2
if (beginIndex < 0)
{
3
throw new StringIndexOutOfBoundsException(beginIndex);
4
}
5
if (endIndex > count)
{
6
throw new StringIndexOutOfBoundsException(endIndex);
7
}
8
if (beginIndex > endIndex)
{
9
throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
10
}
11
return ((beginIndex == 0) && (endIndex == count)) ? this :
12
new String(offset + beginIndex, endIndex - beginIndex, value);
13
}
再让我们接下来看看 new String(offset + beginIndex, endIndex - beginIndex, value); 的实现:
1
// Package private constructor which shares value array for speed.
2
String(int offset, int count, char value[])
{
3
this.value = value;
4
this.offset = offset;
5
this.count = count;
6
}
char[] value 数组被共享了。
在我们的main函数里的循环中,每循环一次后,我们希望Huge对象被回收,且释放它占有的内存。
但实际上 private String str = new String(new char[100000]); 占有的内存并不会被释放。
因为 我们通过 Huge 类的 getSubString 方法得到的 String 对象还存在(存在于handler的列表中),
它虽然是 length 只有 4 的对象,却享有着 char[100000] 的空间。
解决方案:
可以修改Huge 类的 getSubString 方法如下:
1
public String getSubString(int begin, int end)
{
2
return new String(str.substring(begin, end));
3
}
只要再套一个String的构造方法即可。
至于为什么,看看JDK源码,一看便知了。这里就不贴出来了。
唉,以后写代码得多多小心啊。
----2010年08月27日
本文为原创,欢迎转载,转载请注明出处BlogJava。