您的位置 首页 java

Java中的equals和hashCode方法

一:Object规范

  • 在应用程序的执行期间,只要对象的equals方法的比较操作所用到的信息没有被修改,那么对这同一对象调用多次,hashCode方法都必须如一地返回同一个整数.在同一个应用程序的多次执行过程中,每次执行所返回的整数可以不一致.
  • 如果两个对象根据根据equals(Object)方法比较是相等的,那么调用这两个对象中任意一个对象的hashCode方法都必须产生同样的整数结果.
  • 如果两个对象根据equals(Object)方法比较是不相等的,那么调用这两个对象中任意一个对象的hashCode方法,则不一定要产生不同的整数结果.但是程序员应该知道,给不相等的对象产生截然不同的整数结果,有可能提高 散列表 的性能.

设计equals方法和hashCode方法时,一定要满足以上三条规范.

在编码中,经常违反的是第二条,如覆盖equals方法时,没有覆盖hashCode方法.

从规范中可以看出:

(1)未修改对象,每次调用对象的hashCode结果都相同.(如采用随机函数生成hashCode就是一种错误的方法).

(2)两个对象的hashCode方法返回的整数相等,但equals方法不一定相等,如 hashMap 容器

(3)两个对象的equals方法相等,则hashCode返回的散列值一定相等.

(4)两个对象的equals方法不相等,hashCode返回的散列码可以相等也可以不相等.

二:散列函数

在设计hashCode函数过程中,经常要使用到散列函数.

一个好的散列函数通常倾向于” 为不相等的对象产生不相等的散列码 “.这正是hashCode约定中第三条的含义.

一种简单的解决方法:

  1. 把某个非零的质数值,比如说17,保存再一个名为result的int类型的变量中.
  2. 对于对象中的每个关键字f(指equals方法中涉及的每个域),完成以下步骤:

a. 为该域计算int类型的散列码c:

(1)如果该域是 boolean 类型,则计算(f?1:0)

(2)如果该域是byte, char , short 或者int类型,则计算(int)f

(3)如果该域是 long 类型,则计算(int)(f^(f>>>32))

(4)如果该域是float类型,则计算Float.floatToIntBits(f).

(5)如果该域是 Double 类型,则计算Double.doubleToLongBits(f),然后安装步骤2.a.(3),为得到的long类型计算散列值

(6)如果该域是一个对象引用,并且该类的equals方法通过递归地调用equals的方式累比较这个域,则同样为这个域递归地调用hashCode.如果需要更复杂的比较,则为这个域计算一个”范式”,然后针对这个范式调用hashCode.如果这个域的值为NULL,则返回0(或者其它某个常数,但通常是0).

(7)如果该域是一个数组,则要把每一个元素当做单独的域来处理.也就是说,递归地应用上述规则,对每个重要的元素计算一个散列码,然后根据步骤2.b中的做法把这些散列值组合起来.如果数组域中的每个元素都很重要,可以利用发行版本1.5中增加的其中一个Arrays.hashCode方法.

b. 按照下面的公式,把步骤2.a中计算得到的散列码c合并到result中:

result = 31 * result + c;

3.返回result.

4.写完hashCode方法之后,问问自己”相等的实例是否都具有相等的散列码”.

Q&A

(1)为什么初始化选择17?

A: 如果初始值非0,则2.a中计算的散列值为0的初始域会影响到散列值.

如果初始值为0,则整个散列值不会受这些初始域的影响 ,因为这些初始域会增加冲突的可能性.

值17是任选的.

(2)2.b中为什么选择31?

A: 因为31是一个奇素数,如果 乘数 是偶数,并且乘法溢出的话,信息就好丢失 ,因为与2相乘等价于移位运算,使用素数的好处并不很明显, 但是习惯上都使用素数来计算散列结果 .

并且31有个很好的特性,即用移位和减法来代替乘法,可以得到更好的性能 :

31 * i = = (i << 5) – i. 现代的vm可以自动完成这种优化.

文章来源:智云一二三科技

文章标题:Java中的equals和hashCode方法

文章地址:https://www.zhihuclub.com/196996.shtml

关于作者: 智云科技

热门文章

网站地图