并发实践之一：HashMap的非线程安全性和ConcurrentHasMap

Posted on 2010-09-05 17:12 kangaroo 阅读(12235) 评论(5) 编辑收藏所属分类: tech/多线程

在平时开发中，我们经常采用HashMap来作为本地缓存的一种实现方式，将一些如系统变量等数据量比较少的参数保存在HashMap中，并将其作为单例类的一个属性。在系统运行中，使用到这些缓存数据，都可以直接从该单例中获取该属性集合。但是，最近发现，HashMap并不是线程安全的，如果你的单例类没有做代码同步或对象锁的控制，就可能出现异常。

首先看下在多线程的访问下，非现场安全的HashMap的表现如何，在网上看了一些资料，自己也做了一下测试：

public class MainClass {
2

public static final HashMap<String, String> firstHashMap=new HashMap<String, String>();
4

public static void main(String[] args) throws InterruptedException {
6

//线程一
8

Thread t1=new Thread(){
9

public void run() {
10

for(int i=0;i<25;i++){
11

firstHashMap.put(String.valueOf(i), String.valueOf(i));
12

}
13

}
14

};
15

//线程二
17

Thread t2=new Thread(){
18

public void run() {
19

for(int j=25;j<50;j++){
20

firstHashMap.put(String.valueOf(j), String.valueOf(j));
21

}
22

}
23

};
24

t1.start();
26

t2.start();
27

//主线程休眠1秒钟，以便t1和t2两个线程将firstHashMap填装完毕。
29

Thread.currentThread().sleep(1000);
30

for(int l=0;l<50;l++){
32

//如果key和value不同，说明在两个线程put的过程中出现异常。
33

if(!String.valueOf(l).equals(firstHashMap.get(String.valueOf(l)))){
34

System.err.println(String.valueOf(l)+":"+firstHashMap.get(String.valueOf(l)));
35

}
36

}
37

}
39

}

上面的代码在多次执行后，发现表现很不稳定，有时没有异常文案打出，有时则有个异常出现：

为什么会出现这种情况，主要看下HashMap的实现：

public V put(K key, V value) {
2

if (key == null)
3

return putForNullKey(value);
4

int hash = hash(key.hashCode());
5

int i = indexFor(hash, table.length);
6

for (Entry<K,V> e = table[i]; e != null; e = e.next) {
7

Object k;
8

if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
9

V oldValue = e.value;
10

e.value = value;
11

e.recordAccess(this);
12

return oldValue;
13

}
14

}
15

modCount++;
17

addEntry(hash, key, value, i);
18

return null;
19

}

我觉得问题主要出现在方法addEntry，继续看：

void addEntry(int hash, K key, V value, int bucketIndex) {
2

Entry<K,V> e = table[bucketIndex];
3

table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
4

if (size++ >= threshold)
5

resize(2 * table.length);
6

}

从代码中，可以看到，如果发现哈希表的大小超过阀值threshold，就会调用resize方法，扩大容量为原来的两倍，而扩大容量的做法是新建一个Entry[]：

void resize(int newCapacity) {
2

Entry[] oldTable = table;
3

int oldCapacity = oldTable.length;
4

if (oldCapacity == MAXIMUM_CAPACITY) {
5

threshold = Integer.MAX_VALUE;
6

return;
7

}
8

Entry[] newTable = new Entry[newCapacity];
10

transfer(newTable);
11

table = newTable;
12

threshold = (int)(newCapacity * loadFactor);
13

}

一般我们声明HashMap时，使用的都是默认的构造方法：HashMap<K,V>，看了代码你会发现，它还有其它的构造方法：HashMap(int initialCapacity, float loadFactor)，其中参数initialCapacity为初始容量，loadFactor为加载因子，而之前我们看到的threshold = (int)(capacity * loadFactor); 如果在默认情况下，一个HashMap的容量为16，加载因子为0.75，那么阀值就是12，所以在往HashMap中put的值到达12时，它将自动扩容两倍，如果两个线程同时遇到HashMap的大小达到12的倍数时，就很有可能会出现在将oldTable转移到newTable的过程中遇到问题，从而导致最终的HashMap的值存储异常。

JDK1.0引入了第一个关联的集合类HashTable，它是线程安全的。HashTable的所有方法都是同步的。
JDK2.0引入了HashMap，它提供了一个不同步的基类和一个同步的包装器synchronizedMap。synchronizedMap被称为有条件的线程安全类。
JDK5.0util.concurrent包中引入对Map线程安全的实现ConcurrentHashMap，比起synchronizedMap，它提供了更高的灵活性。同时进行的读和写操作都可以并发地执行。

所以在开始的测试中，如果我们采用ConcurrentHashMap，它的表现就很稳定，所以以后如果使用Map实现本地缓存，为了提高并发时的稳定性，还是建议使用ConcurrentHashMap。

====================================================================

另外，还有一个我们经常使用的ArrayList也是非线程安全的，网上看到的有一个解释是这样：
一个 ArrayList 类，在添加一个元素的时候，它可能会有两步来完成：1. 在 Items[Size] 的位置存放此元素；2. 增大 Size 的值。
在单线程运行的情况下，如果 Size = 0，添加一个元素后，此元素在位置 0，而且 Size=1；
而如果是在多线程情况下，比如有两个线程，线程 A 先将元素存放在位置 0。但是此时 CPU 调度线程A暂停，线程 B 得到运行的机会。线程B也将元素放在位置0，（因为size还未增长），完了之后，两个线程都是size++，结果size变成2，而只有items[0]有元素。
util.concurrent包也提供了一个线程安全的ArrayList替代者CopyOnWriteArrayList。

# re: 并发实践之一：HashMap的非线程安全性和ConcurrentHasMap 回复 更多评论

2010-09-06 12:27 by xylz

"如果两个线程同时遇到HashMap的大小达到12的倍数时，就很有可能会出现在将oldTable转移到newTable的过程中遇到问题，从而导致最终的HashMap的值存储异常"

如果只有一个线程到达阈值，另一个线程读写同样会有问题，因为rehash的时候同一个元素的索引index会变化（不是固定的）。

# re: 并发实践之一：HashMap的非线程安全性和ConcurrentHasMap 回复 更多评论

2010-09-06 17:19 by tanlun

@xylz
是的，多次出现25=null，不是巧合。

# re: 并发实践之一：HashMap的非线程安全性和ConcurrentHasMap[未登录] 回复 更多评论

2014-01-04 10:08 by xx

这个例子是错误的呀！

# re: 并发实践之一：HashMap的非线程安全性和ConcurrentHasMap[未登录] 回复 更多评论

2014-01-04 10:10 by xx

import java.util.HashMap;
import java.util.Map;

public class TestHashMap {

public static final HashMap<String, String> firstHashMap=new HashMap<String, String>();
public static void main(String[] args) throws InterruptedException {

//线程一
Thread t1=new Thread(){
public void run() {
for(int i=0;i<25;i++){
firstHashMap.put(String.valueOf(i), String.valueOf(i));
}
}
};

//线程二
Thread t2=new Thread(){
public void run() {
for(int j=25;j<50;j++){
firstHashMap.put(String.valueOf(j), String.valueOf(j));
}
}
};

t1.start();
t2.start();

//主线程休眠1秒钟，以便t1和t2两个线程将firstHashMap填装完毕。
Thread.currentThread().sleep(10000);

for(int l=0;l<50;l++){
//如果key和value不同，说明在两个线程put的过程中出现异常。
//System.out.println(firstHashMap.get(String.valueOf(l))+" "+l);
if(!String.valueOf(l).equals(firstHashMap.get(String.valueOf(l)))){
System.err.println(String.valueOf(l)+":"+firstHashMap.get(String.valueOf(l)));
//System.out.println("===="+firstHashMap.get(String.valueOf(l))+" "+l);
}
}
System.out.println(firstHashMap.size());
System.out.println("ddd==========");
for(Map.Entry<String,String> item:firstHashMap.entrySet()){
System.out.println(item.getKey()+" "+item.getValue());
}
}

}

遍历map结果完全正确，多次执行也还是正确的。源程序输出异常是因为两个线程还没有执行完吧。

# re: 并发实践之一：HashMap的非线程安全性和ConcurrentHasMap 回复 更多评论

2015-04-01 11:19 by xxxx

不是很懂!

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: 并发实践之二：管理线程的四个方法start, sleep, yield, join；线程间协作的方法wait,notify 并发实践之一：HashMap的非线程安全性和ConcurrentHasMap

我的自留地