Chan Chen Coding...

hashcode() and equal()

equal方法 
Object类的equals方法用于检测一个对象是否等于另外一个对象,而Object类中这个方法的定义为两个对象是否具有相同的引用。源码如下: 
Java代码
public boolean equals(Object obj) {  
    return (this == obj);  
    }  
看起来没有什么问题,两个对象具有相同的引用,那这两个对象一定是相等的,但在实际应用中,这样的比较其实并没有什么实际意义,经常发生的场景就是需要比较两个对象的状态的相等性,比如某个对象的唯一性标识一致我们就认为这两个对象相等。java规范中对equal方法有如下要求 
自反性:对于任何非空引用x,x,equal(x)应该返回true 
对称性:对于任何引用x,x如果x.equal(y)返回true,那么y.equal(x)也应该返回true 
传递性:对于任何x,y,z,如果x.equal(y)返回true,y.equal(z)返回true,那么z.equal(x)返回true也应该返回true。 
一致性:如果x,y的引用没有发生变化,那么反复调用equal方法应该返回同样的结果 
非空性:对于任意非空引用x,x.equal(null)都应该返回false 
为了满足实际需要,这个时候我们就需要重写equal方法,针对规范,比较典型的写法如下: 
Java代码 
/** 
     * 
@author GraMind 
     * 
@param obj 
     * 
@return 
     * 
@exception  
     * 
@see java.lang.Object#equals(java.lang.Object) 
     
*/  
    @Override  
    public boolean equals(Object obj)  
    {  
        if (this == obj)                                         1  
            return true;  
        if (obj == null)                                         2  
            return false;  
        if (getClass() != obj.getClass())                        3  
            return false;  
        ClassName other = (ClassName) obj;                       4  
        if (id != other.id)                                      5  
            return false;  
        .  
        return true;  
    }  

对于上面的代码 
1)检测两者是否引用同一个对象 
2)检测object是否为null,如果为null直接返回false 
3)避免父子类引用相同的域(比如上类父子都具有id属性),比较是否属于同一级类,如果每个子类都具有统一的语义也可以使用instanceof来检测 
4)转换要比较的类为对应的类类型变量 
5)根据需要比较相应的域 
注意:如果在子类中重写了equal方法,就要在其中包含super.equal(...)。 
散列码 
散列码是有对象导出来的一个整形值,且没有规律。如果重写equal方法那么就必须重写hashCode方法 
想要明白为什么这样做,你必须要先知道Java中的集合。   
总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。 
你知道它们的区别吗?前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。 
那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢? 
这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。 
也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。    
于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。 
哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。 
初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是,比如大家可以看下String的hashCode实现)。   
这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。 
如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了, 
就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。 
所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。   
所以,Java对于eqauls方法和hashCode方法是这样规定的: 
1、如果两个对象相同,那么它们的hashCode值一定要相同;2、如果两个对象的hashCode相同,它们并不一定相同     上面说的对象相同指的是用eqauls方法比较。 

-----------------------------------------------------
Silence, the way to avoid many problems;
Smile, the way to solve many problems;

posted on 2012-11-03 11:00 Chan Chen 阅读(279) 评论(0)  编辑  收藏 所属分类: Scala / Java


只有注册用户登录后才能发表评论。


网站导航: