Hashtable類
Hashtable繼承Map接口,實(shí)現(xiàn)一個(gè)key-value映射的哈希表。任何非空(non-null)的對(duì)象都可作為key或者value。
添加數(shù)據(jù)使用put(key,value),取出數(shù)據(jù)使用get(key),這兩個(gè)基本操作的時(shí)間開銷為常數(shù)。
Hashtable通過initial capacity和load factor兩個(gè)參數(shù)調(diào)整性能。通常缺省的load factor 0.75較好地實(shí)現(xiàn)了時(shí)間和空間的均衡。增大load factor可以節(jié)省空間但相應(yīng)的查找時(shí)間將增大,這會(huì)影響像get和put這樣的操作。
使用Hashtable的簡(jiǎn)單示例如下,將1,2,3放到Hashtable中,他們的key分別是”one”,”two”,”three”:
Hashtable numbers = new Hashtable();
numbers.put(“one”, new Integer(1));
numbers.put(“two”, new Integer(2));
numbers.put(“three”, new Integer(3));
要取出一個(gè)數(shù),比如2,用相應(yīng)的key:
Integer n = (Integer)numbers.get(“two”);
System.out.println(“two = ” + n);
由于作為key的對(duì)象將通過計(jì)算其散列函數(shù)來確定與之對(duì)應(yīng)的value的位置,因此任何作為key的對(duì)象都必須實(shí)現(xiàn)hashCode和equals方法。hashCode和equals方法繼承自根類Object,如果你用自定義的類當(dāng)作key的話,要相當(dāng)小心,按照散列函數(shù)的定義,如果兩個(gè)對(duì)象相同,即obj1.equals(obj2)=true,則它們的hashCode必須相同,但如果兩個(gè)對(duì)象不同,則它們的hashCode不一定不同,如果兩個(gè)不同對(duì)象的hashCode相同,這種現(xiàn)象稱為沖突,沖突會(huì)導(dǎo)致操作哈希表的時(shí)間開銷增大,所以盡量定義好的hashCode()方法,能加快哈希表的操作。
如果相同的對(duì)象有不同的hashCode,對(duì)哈希表的操作會(huì)出現(xiàn)意想不到的結(jié)果(期待的get方法返回null),要避免這種問題,只需要牢記一條:要同時(shí)復(fù)寫equals方法和hashCode方法,而不要只寫其中一個(gè)。 Hashtable是同步的。
HashMap類
HashMap和Hashtable類似,不同之處在于HashMap是非同步的,并且允許null,即null value和null key。,但是將HashMap視為Collection時(shí)(values()方法可返回Collection),其迭代子操作時(shí)間開銷和HashMap的容量成比例。因此,如果迭代操作的性能相當(dāng)重要的話,不要將HashMap的初始化容量設(shè)得過高,或者load factor過低。
WeakHashMap類
WeakHashMap是一種改進(jìn)的HashMap,它對(duì)key實(shí)行“弱引用”,如果一個(gè)key不再被外部所引用,那么該key可以被GC回收。
HashSet請(qǐng)參考對(duì)Set的描述
Set是一種不包含重復(fù)的元素的Collection,即任意的兩個(gè)元素e1和e2都有e1.equals(e2)=false,Set最多有一個(gè)null元素。
Set的構(gòu)造函數(shù)有一個(gè)約束條件,傳入的Collection參數(shù)不能包含重復(fù)的元素。
請(qǐng)注意:必須小心操作可變對(duì)象(Mutable Object)。如果一個(gè)Set中的可變?cè)馗淖兞俗陨頎顟B(tài)導(dǎo)致Object.equals(Object)=true將導(dǎo)致一些問題。
兩個(gè)通用Set實(shí)現(xiàn)是HashSet和TreeSet。要決定用哪一個(gè),那是非常簡(jiǎn)單明了的。HashSet要快得多(對(duì)大多數(shù)操作是常數(shù)時(shí)間之于對(duì)數(shù)時(shí)間(constant time vs. log time)), 但不提供排序保證。如果你需要使用 SortedSet 中的操作,或者按順序迭代對(duì)你來說是重要的,那么請(qǐng)使用 TreeSet。 否則,使用 HashSet。 在大多數(shù)時(shí)間都不使用 HashSet ,對(duì)你來說是個(gè)公平的賭博。
關(guān)于HashSet,有一件事應(yīng)該牢記,即就條目數(shù)和容量之和來講,迭代是線性的。因此,如果迭代性能很重要,那就應(yīng)該慎重選擇一個(gè)適當(dāng)?shù)某跏既萘俊H萘窟x得太大,既浪費(fèi)空間,也浪費(fèi)時(shí)間。 默認(rèn)的初試容量是101, 一般來講,它比你所需要的要多。可以使用 int 構(gòu)造函數(shù)來指定初始容量。要分配 HashSet 的初始容量為17:
Set s= new HashSet(17);
HashSets另有一個(gè)稱作 裝載因數(shù)(load factor)的"調(diào)整參數(shù)(tuning parameter)" 。如果你非常在乎你的HashSet的空間的使用,請(qǐng)閱讀HashSet文本以獲取詳細(xì)信息。否則,就使用默認(rèn)值吧。如果你接受默認(rèn)裝載因數(shù),但你確實(shí)又想指定初始容量,那么,選一個(gè)大約是你期望你的 Set 將增長(zhǎng)到的容量的兩倍的數(shù)。如果你的猜測(cè)不著邊,它也可以增長(zhǎng),或只是浪費(fèi)一點(diǎn)空間。但都沒有大問題。如果你知道有關(guān)正確尺寸的一個(gè)最佳值,用它吧;如果不知道,那就使用一個(gè)舊的值,或使用一個(gè)偶數(shù)值。它真的不是非常重要。這些事情只能使 HashSet 稍稍變好一點(diǎn)點(diǎn)。
TreeSet沒有調(diào)整參數(shù)。除clone之外,HashSet和TreeSet都僅有那些由它們各自的接口所要求的操作(Set和TreeSet),而沒有任何別的操作。