Object中的hashCode()
hashCode方法用來返回對象的哈希值,提供該方法是為了支持哈希表,例如HashMap,HashTable等,在Object類中的代碼如下:
1
|
public native int hashCode(); |
這是一個native聲明的本地方法,返回一個int型的整數。由于在Object中,因此每個對象都有一個默認的哈希值。
在openjdk8根路徑/hotspot/src/share/vm/runtime路徑下的synchronizer.cpp文件中,有生成哈希值的代碼:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
|
static inline intptr_t get_next_hash(Thread * Self, oop obj) { intptr_t value = 0 ; if (hashCode == 0 ) { // 返回隨機數 value = os::random() ; } else if (hashCode == 1 ) { //用對象的內存地址根據某種算法進行計算 intptr_t addrBits = cast_from_oop<intptr_t>(obj) >> 3 ; value = addrBits ^ (addrBits >> 5 ) ^ GVars.stwRandom ; } else if (hashCode == 2 ) { // 始終返回1,用于測試 value = 1 ; } else if (hashCode == 3 ) { //從0開始計算哈希值 value = ++GVars.hcSequence ; } else if (hashCode == 4 ) { //輸出對象的內存地址 value = cast_from_oop<intptr_t>(obj) ; } else { // 默認的hashCode生成算法,利用xor-shift算法產生偽隨機數 unsigned t = Self->_hashStateX ; t ^= (t << 11 ) ; Self->_hashStateX = Self->_hashStateY ; Self->_hashStateY = Self->_hashStateZ ; Self->_hashStateZ = Self->_hashStateW ; unsigned v = Self->_hashStateW ; v = (v ^ (v >> 19 )) ^ (t ^ (t >> 8 )) ; Self->_hashStateW = v ; value = v ; } value &= markOopDesc::hash_mask; if (value == 0 ) value = 0xBAD ; assert (value != markOopDesc::no_hash, "invariant" ) ; TEVENT (hashCode: GENERATE) ; return value; } |
源碼中的hashCode其實是JVM啟動的一個參數,每一個分支對應一個生成策略,通過-XX:hashCode可以切換hashCode的生成策略。
下面驗證第2種生成策略,用軟件idea輸入參數-XX:hashCode=2,可以看到輸出結果正是1,從而進一步驗證了上面的源碼。
hashCode()和equals()
hashCode()和equals()用來標識對象,兩個方法協同工作用來判斷兩個對象是否相等。對象通過調用 Object.hashCode()生成哈希值,由于不可避免地會存在哈希值沖突的情況 因此hashCode 相同時 還需要再調用 equals 進行一次值的比較,但是若hashCode不同,將直接判定兩個對象不同,跳過 equals ,這加快了沖突處理效率。 Object 類定義中對 hashCode和 equals 要求如下:
- 如果兩個對象的equals的結果是相等的,則兩個對象的 hashCode 的返回結果也必須是相同的。
- 任何時候重寫equals,都必須同時重寫hashCode。
下面看一個小例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
|
import java.util.HashMap; import java.util.Objects; /** * @author mazouri * @create 2021-08-10 23:59 */ public class Person { //用戶Id,唯一確定用戶 private String id; private String name; public Person(String id, String name) { this .id = id; this .name = name; } @Override public boolean equals(Object o) { if ( this == o) return true ; if (!(o instanceof Person)) return false ; Person person = (Person) o; return Objects.equals(id, person.id) && Objects.equals(name, person.name); } public static void main(String[] args) { HashMap<Person, Integer> map = new HashMap<>(); //key:Person類型 value:Integer類型 map.put( new Person( "1" , "張三" ), 100 ); System.out.println(map.get( new Person( "1" , "張三" ))); } } |
我們將Person類的實例作為key,value為這個對象的考試成績。我們期望通過map.get(new Person("1", "張三"))獲取該對象的考試成績,但上面代碼的輸出結果為null。原因就在于Person類中沒有覆蓋hashCode方法,從而導致兩個相等的實例具有不同的哈希值。HashMap中get()的核心代碼如下
1
2
|
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return first; |
if條件表達式中的e.hash == hash是先決條件,只有相等才會執行&&后面的代碼。equals不相等時并不強制要求哈希值相等,但是一個優秀的哈希算法應盡可能讓元素均勻分布,降低沖突發生的概率,即在equals不相等時盡量讓哈希值也不相等,這樣&&或||短路操作一旦生效,會極大提高程序的效率。像上面的例子,因為沒有重寫hashCode方法,兩個對象有兩個哈希值,獲取對象時可能在別的哈希桶中查找,即使湊巧在一個哈希桶,因為哈希值不一樣,也找不到原來那一個對象。
你可以根據你自己的需求設計重寫hashCode方法,或者調用JDK提供好的,比如
1
2
3
4
|
@Override public int hashCode() { return Objects.hash(id, name); } |
這樣就能解決問題,但是這個運行速度慢一些,因為它們會引發數組的創建,以便傳入數目可變的參數, 如果參數中有基本類型,還需要裝箱和拆箱 ,建議只將這類散列函數用于不太注重性能的情況。
重寫的hashCode()方法
Java為許多常用的數據類型重寫了hashCode()方法,比如String,Integer,Double等。比如在Integer類中哈希值就是其int類型的數據。
1
2
3
|
public static int hashCode( int value) { return value; } |
總結
本篇文章就到這里了,希望能給你帶來幫助,也希望您能夠多多關注服務器之家的更多內容!
原文鏈接:https://blog.csdn.net/weixin_46215617/article/details/119611129