HASHTABLE的内部实现

public class TestHashtable {

public static void main(String[] args){

Hashtable ht = new Hashtable();

ht.put("sichuan","chengdu"); //改变以下四行代码的顺序，可能会改变输出内容的顺序

ht.put("hunan","changsha");

ht.put("beijing","beijing");

ht.put("anhui","hefei");

Enumeration e = ht.keys();

while(e.hasMoreElements()) {

Object key = e.nextElement();

Object value = ht.get(key);

System.out.println(key + " " + value + " " + key.hashCode() + " " + value.hashCode());

}

为了讲述Hashtable键排序的问题，我们先来看Hashtable的结构图：

从上面的结构图可以看出，Hashtable的实质就是一个数组＋链表。图中的Entry就是链表的实现，Entry的结构中包含了对自己的另一个实例的引用next，用以指向另外一个Entry。而图中标有数字的部分是一个Entry数组，数字就是这个Entry数组的index。那么往Hashtable增加键值对的时候，index会根据键的hashcode、Entry数组的长度共同决定，从而决定键值对存放在Entry数组的哪个位置。从这种意义来说，当键一定，Entry数组的长度一定的情况下，所得到的index肯定是相同的，也就是说插入顺序应该不会影响输出的顺序才对。然而，还有一个重要的因素没有考虑，就是计算index出现相同值的情况。譬如代码中 "sichuan" 和 "anhui"，所得到的index是相同的，在这个时候，Entry的链表功能就发挥作用了：put方法通过Entry的next属性获得对另外一个Entry的引用，然后将后来者放入其中。根据debug得出的结果，"sichuan", "anhui"的index同为2，"hunan"的index为6，"beijing"的index为1，在输出的时候，会以index递减的方式获得键值对。很明显，会改变的输出顺序只有"sichuan"和"anhui"了，也就是说输出只有两种可能："hunan" - "sichuan" - "anhui" - "beijing"和"hunan" - "anhui" - "sichuan" - "beijing"。以下是运行了示例代码之后，Hashtable的结果：

        以上的讨论基于Java展开的，在C#中的Hashtable实现会有所不同，但是我相信两者的设计应该是差不多的。感谢叶漂和quitgame，给了我思考的机会，也让我感到了基础知识的匮乏，看来是要补补基础知识了。

        [补充]：在Hashtable的实现代码中，有一个名为rehash的方法用于扩充Hashtable的容量。很明显，当rehash方法被调用以后，每一个键值对相应的index也会改变，也就等于将键值对重新排序了。这也是往不同容量的Hashtable放入相同的键值对会输出不同的键值对序列的原因。在Java中，触发rehash方法的条件很简单：hahtable中的键值对超过某一阀值。默认情况下，该阀值等于hashtable中Entry数组的长度×0.75

posted on 2008-02-19 11:07 晓宇阅读(1663) 评论(0) 编辑收藏

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理

csusky

导航

留言簿(2)

随笔分类

随笔档案

阅读排行榜

评论排行榜

常用链接

统计

最新评论

HASHTABLE的内部实现