[集合]Collection集合框架源码分析

时间:2021-02-25 06:01:32

Collection接口

在java的集合类库中,基本接口是Collection,该接口的在集合中的源码定义如下(将源码中的注释删掉了):

 public interface Collection<E> extends Iterable<E> {
// Query Operations
// 查询操作相关方法 // 返回集合的元素个数
int size(); // 如果这个集合没有包含任何元素了就返回true,即判断集合是否为空
boolean isEmpty(); // 如果这个集合至少包含一个指定的元素就返回true,
//如果指定的元素和集合中的元素不兼容,会抛出 ClassCastException
// 如果指定的元素为空并且该集合不允许元素为空时,会抛出 NullPointerException
boolean contains(Object o); // 返回集合中元素的迭代器,它不保证元素的有序性 (除非该集合本身的实现可以保证元素的顺序)
Iterator<E> iterator(); // 返回一个包含集合中所有元素的数组,元素的顺序性和 iterator 一样,由集合实现类本身决定
// 这个方法返回的数组时安全的,因为集合不用保留对返回数组的引用,我们可以任意修改而不影响集合本身
Object[] toArray(); // 返回包含该集合中所有元素的数组,数组的运行时类型是指定数组的类型,
// 如果指定的数组适合集合的大小,直接返回其中,否则重新创建数组
<T> T[] toArray(T[] a); // Modification Operations // 往集合中添加一个元素,如果集合允许更改就返回true,如果集合不允许元素重复并且已经包含了此元素,则返回false
boolean add(E e); // 从集合中删除指定元素的单个实例 如果集合允许改变就返回true
boolean remove(Object o); // Bulk Operations
// 批量操作相关 // 如果该集合包含指定集合的所有元素 则返回true
boolean containsAll(Collection<?> c); // 添加指定集合的所有元素到该集合中
// 如果在添加操作的过程中修改了指定的集合 ,则此操作的行为是不确定的,不安全
boolean addAll(Collection<? extends E> c); // 在该集合中删除指定集合的所有元素,反方法成功返回后,该集合中将不再包含任何指定集合中的元素
boolean removeAll(Collection<?> c); // 删除满足给定条件的所有元素,如果在迭代期间发生运行时异常,那么将返回给调用者
// 注意:这是JDK1.8 的新特性,在接口中也有方法实现,实现类调用时的默认实现逻辑
default boolean removeIf(Predicate<? super E> filter) {
Objects.requireNonNull(filter);
boolean removed = false;
final Iterator<E> each = iterator();
while (each.hasNext()) {
if (filter.test(each.next())) {
each.remove();
removed = true;
}
}
return removed;
} // 从集合中删除不包含在指定集合中的所有元素
boolean retainAll(Collection<?> c); // 清空集合中的所有元素,该方法返回后,集合将为空
void clear(); // Comparison and hashing
// 比较和散列 // 将指定的对象与集合进行比较
boolean equals(Object o); // 返回在这个集合的hashCode值
int hashCode(); // 在此集合中的元素上创建Spliterator/
// jdk 1.8 的新特性
@Override
default Spliterator<E> spliterator() {
return Spliterators.spliterator(this, 0);
} // 返回以此集合为源的顺序Stream。/
// jdk 1.8 的新特性
default Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
} // 以此集合作为源返回可能并行的Stream。 此方法允许返回顺序流。/
// jdk1.8 新特性
default Stream<E> parallelStream() {
return StreamSupport.stream(spliterator(), true);
}
}

上面的源码中第17行的 iterator () 返回了一个迭代器对象 Iterator,可以使用这个迭代器一次访问集合中的元素。 Iterator 是一个接口,看看它在源码中的定义:

 public interface Iterator<E> {

     // 如果这个迭代器对象还有元素的话就返回true
boolean hasNext(); // 返回这个迭代器中的下一个元素
E next(); // 从底层集合中移除此迭代器返回的最后一个元素。 每次调用next时,只能调用一次此方法。
default void remove() {
throw new UnsupportedOperationException("remove");
} // 对集合中剩余的每个元素执行给定的操作,知道处理完所有元素或者引发异常
// jdk 1.8 新特性
default void forEachRemaining(Consumer<? super E> action) {
Objects.requireNonNull(action);
while (hasNext())
action.accept(next());
}
}

看完了这个迭代器,我们应该对集合元素的遍历方法有所思考,我们可以反复的调用hasNext,next 方法逐个的访问集合元素,我们还可以使用“for each” 带迭代器的循环访问任何实现了Iterable接口的对象,Iterable接口中定义的方法 都是为了迭代元素而存在的

 public interface Iterable<T> {

     Iterator<T> iterator();

     // 1.8 新特性
default void forEach(Consumer<? super T> action) {
Objects.requireNonNull(action);
for (T t : this) {
action.accept(t);
}
} // 1.8 新特性
default Spliterator<T> spliterator() {
return Spliterators.spliteratorUnknownSize(iterator(), 0);
}
}

  而Collection接口扩展了 Iterable 接口,因此凡是 Collection 接口的实现,我们都可以使用“for each” 循环来遍历所有的元素。在JDK 1.8 中,我们甚至可以调用 forEachRemaining 方法并提供一个Lambda 表达式定义处理剩余元素的逻辑,知道结束。这3中迭代集合元素的方法我们会根据实际需求来选择。还有一个很重的问题就是元素被访问的顺序,它取决于集合的实现类型,后面我们将会对每一种实现类型详细分析。另外当我们使用迭代器来删除集合中的元素时,必须使用next方法先返回要删除的元素,然remove该元素,也就是这两个方法必须一前一后,否则将会抛出 IllegalStateException 异常。

  Collection接口中声明了很多对于集合来说很有用的方法,那么每一个Collection接口的实现类都应该具有这些通用的功能,但是每一种实现类都要重复这些逻辑,岂不烦人?于是在Collection接口的具体实现类之上提供了一个Collection的抽象实现 AbstractCollection,在该抽象类中,它将size,iterator 方法抽象化了,由具体集合实现类去完成。但是实现了集合的相关通用方法,当然,如果子类有更高效的实现的话,是可以覆盖的。

  在AbstractCollection抽象类中实现的通用方法主要有:

    • public boolean contains(Object o)
    public boolean contains(Object o) {
// 得到一个迭代器对象,用于遍历集合的元素
Iterator<E> it = iterator();
// 如果需要判断的对象是 null 值
if (o==null) {
while (it.hasNext())
if (it.next()==null) // 集合包含null 返回true
return true;
} else { // 判断的对象不为null
while (it.hasNext()) // 循环遍历结合查找匹配
if (o.equals(it.next())) // 使用传入对象的equals方法判断
return true;
}
return false; // 没有找到,,返回false
}
    •     public Object[] toArray() 
    public Object[] toArray() {
// Estimate size of array; be prepared to see more or fewer elements
// 创建一个和集合元素个数相同的对象数组,用于存储元素数据
Object[] r = new Object[size()];
// 返回迭代器
Iterator<E> it = iterator();
// 循环将集合元素放入对象数组中
for (int i = 0; i < r.length; i++) {
if (! it.hasNext()) // fewer elements than expected 元素少于预期的个数
return Arrays.copyOf(r, i); // 将包含所有的元素的对象数组返回
r[i] = it.next();
}
// 当迭代器返回的元素多于预期时,重新分配在toArray中使用的数组,并完成从迭代器填充它。否则返回该数组
return it.hasNext() ? finishToArray(r, it) : r;
}
    • public boolean remove(Object o)
    // 调用 Iterator 迭代器的方法执行删除操作
public boolean remove(Object o) {
// 得到一个迭代器对象,用于遍历集合的元素
Iterator<E> it = iterator();
//如果要删除的元素是 null
if (o==null) {
while (it.hasNext()) {
if (it.next()==null) {
it.remove();
return true;
}
}
} else {
while (it.hasNext()) { // 使用传入对象的equals方法判断,找到并删除
if (o.equals(it.next())) {
it.remove();
return true;
}
}
}
return false;
}

以上就是 AbstractCollection主要实现的通用方法,其他的一些方法都是调用这些基本方法实现,或者是等具体的实现类实现的,点击查看更多方法。另外在该抽象类中还定义了如果使用数组实现的数组大小上限:

    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

实现了Collection的接口

[集合]Collection集合框架源码分析

  其中List是一个有序集合。元素会增加到容器中的特定位置。可以采用两种方式访问元素,使用迭代器访问,或者使用一个随机索引来访问,后一种方法为随机访问,这样可以按照任意顺序访问元素,而迭代器则必须顺序的访问元素。下面列出List与之父接口Collection不同的一些方法源码:

 public interface List<E> extends Collection<E> {

     // 将该列表的每个元素替换为 将运算符应用于该元素的结果
// jdk 1.8 特性
default void replaceAll(UnaryOperator<E> operator) {
Objects.requireNonNull(operator);
final ListIterator<E> li = this.listIterator();
while (li.hasNext()) {
li.set(operator.apply(li.next()));
}
} // 根据传入的规则将列表排序
// jdkk 1.8 特性
default void sort(Comparator<? super E> c) {
Object[] a = this.toArray();
Arrays.sort(a, (Comparator) c);
ListIterator<E> i = this.listIterator();
for (Object e : a) {
i.next();
i.set((E) e);
}
} // 返回true的条件是 两个list的元素个数和顺序都相等
boolean equals(Object o); /**
* 计算法则:
* int hashCode = 1;
* for (E e : list)
* hashCode = 31*hashCode + (e==null ? 0 : e.hashCode());
*/
int hashCode(); E get(int index); E set(int index, E element); int indexOf(Object o); int lastIndexOf(Object o); // 返回此列表中元素的列表迭代器
ListIterator<E> listIterator(); // 返回指定索引的视图,也就是该列表的子列表,子列表和源列表的操作是可见的
List<E> subList(int fromIndex, int toIndex); }

List与Collection不同的方法定义

  Set接口等同于Collection(虽然也是继承自Collection接口),其方法的定义都与Collection差不多,但是Set接口方法的行为有更加严谨的要求,Set接口的add方法中不允许有重复的元素。Set方法中equals方法的定义:只要两个Set中含有相同的元素就为true,而不考虑元素的顺序。hashCode方法的定义:保证两个包含相同元素的 Set返回同样的散列码。因为Set中hashCode的计算是所有元素的hashCode之和。在此就不列出Set接口的代码了,具体我们在看具体实现的时候再说。

  SortedSet接口:队列与双端队列的定义,我们可以在方便的在尾部添加元素,头部删除元素,  这样有两个端头的队列,叫做双端队列,但是不能在队列的中间位置插入一个元素。在javase中队列的实现有ArrayDQueue和LinkedList。将在后面介绍。

public interface SortedSet<E> extends Set<E> {

    Comparator<? super E> comparator();

    SortedSet<E> subSet(E fromElement, E toElement);

    SortedSet<E> headSet(E toElement);

    SortedSet<E> tailSet(E fromElement);

    E first();

    E last();

    @Override
default Spliterator<E> spliterator() {
return new Spliterators.IteratorSpliterator<E>(
this, Spliterator.DISTINCT | Spliterator.SORTED | Spliterator.ORDERED) {
@Override
public Comparator<? super E> getComparator() {
return SortedSet.this.comparator();
}
};
}
}

Queue与Deque接口:

Collection的具体实现

[集合]Collection集合框架源码分析

ArrayList:底层基于数组实现,添加元素时判断数组容量,可以动态扩容,相应的功能实现看代码

定义:

public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable { .... }

构造函数及其相关属性:

    // 底层基于数组实现,定义用于存放元素的 对象数组
transient Object[] elementData; // 默认的容量大小
private static final int DEFAULT_CAPACITY = 10; // 创建指定大小的ArrayList时(指定为0)用于初始化一个指定容量的空的对象数组
private static final Object[] EMPTY_ELEMENTDATA = {}; // 创建ArrayList时不指定初始化容量 创建的默认 为空的对象数组
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; // 创建指定大小的ArrayList
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) { // 指定容量等于0 时,创建空的对象数组
this.elementData = EMPTY_ELEMENTDATA;
} else { // 参数不合法
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
} // 创建默认的对象数组
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
} // 根据传入的集合对象创建ArrayList
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class); // 复制数据到对象数组中
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA; // 传入集合为空时
}
}

添加一个元素及其扩容策略:

    public boolean add(E e) {
// 1. 保证容量的合理范围
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
} private void ensureCapacityInternal(int minCapacity) {
// 2. 如果当前对象数组的大小小于 默认容量10 ,那么将容量增加到10
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
} // 根据当前容量判断是否需要扩容
private void ensureExplicitCapacity(int minCapacity) {
modCount++; // overflow-conscious code
// 如果 当前容量小于对象数组的长度,扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity); // 扩容方法
} // 计算当前容量是否小于最小要求10
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
} // 扩容策略
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length; // 当前对象数组的长度
int newCapacity = oldCapacity + (oldCapacity >> 1); // 新的容量等于 当前数组的长度 + 当前数组长度 / 2 ;也就是1.5倍
if (newCapacity - minCapacity < 0) // 扩容容量是否满足最低要求
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0) // 新容量超过允许的数组最大值
newCapacity = hugeCapacity(minCapacity); // 再加大数组的允许范围
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
} private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ? // Integer 的最大值
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}

删除一个元素

[集合]Collection集合框架源码分析

    public E remove(int index) {
// 下标的范围检查
rangeCheck(index); modCount++;
E oldValue = elementData(index); // 即将删除的元素的值,临时保存,为返回用 int numMoved = size - index - 1; // 删除该元素,其他元素移动的次数
if (numMoved > 0) // 移动次数大于0 ,合法
System.arraycopy(elementData, index+1, elementData, index, // 通过拷贝的方式删除一个元素
numMoved);
elementData[--size] = null; // clear to let GC do its work return oldValue; // 返回删除的元素
} private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

用于元素操作的内部类

    // 这三个内部类通过定义就可以看到,它们都是继承了相应的接口
// 针对基于数组实现的ArrayList 方便相应的操作,在这就不一一解释了,都是见名知意的,
private class Itr implements Iterator<E> { } private class ListItr extends Itr implements ListIterator<E> { } private class SubList extends AbstractList<E> implements RandomAccess { }

LinkedList:底层基于链表实现。

定义:

public class LinkedList<E>
extends AbstractSequentialList<E>
implements List<E>, Deque<E>, Cloneable, java.io.Serializable { ... }

构造函数及其相关属性:LinkedList基于链表实现,在其内部定义了一个Node类用户存放数据和维持节点之间的关系。

[集合]Collection集合框架源码分析

    // 记录元素的个数
transient int size = 0; // 链表的第一个节点
transient Node<E> first; // 最后一个节点
transient Node<E> last; // 构造哦一个空的链表
public LinkedList() { } // 根据传入的集合类构建一个链表
// 具体的addAll 在添加元素的时候分析
public LinkedList(Collection<? extends E> c) {
this();
addAll(c);
} // 构造链表的几点,是LinkedList的静态内部类
private static class Node<E> {
E item; // 真实数据
Node<E> next; // 下一个节点
Node<E> prev; // 前一个节点 // 节点的构造函数
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}

添加一个元素:包括在头,尾,中间任意节点插入元素

[集合]Collection集合框架源码分析

    // 在链表的头结点添加一个元素
public void addFirst(E e) {
linkFirst(e);
} private void linkFirst(E e) {
final Node<E> f = first;
final Node<E> newNode = new Node<>(null, e, f); // 根据传入的数据新创建一个节点,将头节点作为下一节点
first = newNode; //更新头结点为新创建的节点
if (f == null) // 如果头结点为空,也就是空链表的时候
last = newNode; // 头等于尾
else
f.prev = newNode; // 原来的头结点的上一节点为新创建的节点
size++;
modCount++;
} // 在链表的末尾添加一个元素
public void addLast(E e) {
linkLast(e);
} void linkLast(E e) {
final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null); // 根据传入的数据新创建一个节点,将原始尾节点作为前一节点
last = newNode; // 更新尾节点
if (l == null) // 为空链表时
first = newNode; // 头等于尾
else
l.next = newNode; // 原始尾节点的下一个等于新创建的节点
size++;
modCount++;
} // 在任意位置插入元素
public void add(int index, E element) {
checkPositionIndex(index); // 索引的范围检查 if (index == size) // 如果 索引是最后个 直接加入
linkLast(element);
else // 否则
linkBefore(element, node(index)); // 在给定索引的元素前面插入该元素
} void linkBefore(E e, Node<E> succ) {
// assert succ != null;
final Node<E> pred = succ.prev; // 给定索引的前一节点
final Node<E> newNode = new Node<>(pred, e, succ); // 创建一个以给定索引的前一节点,以及给定索引为下一节点的新节点
succ.prev = newNode; // 给定索引的节点为新建节点
if (pred == null) // 给定索引的前一节点为空的情况
first = newNode;
else // 否则 给定索引的前一节点的下一节点为新建的节点
pred.next = newNode;
size++;
modCount++;
}

删除一个元素:包括在头,尾,中间任意节点插入元素

[集合]Collection集合框架源码分析

    public E removeFirst() {
final Node<E> f = first;
if (f == null) // 没有元素时 ,抛出异常
throw new NoSuchElementException();
return unlinkFirst(f);
} public E removeLast() {
final Node<E> l = last;
if (l == null) // 没有元素时 ,抛出异常
throw new NoSuchElementException();
return unlinkLast(l);
} private E unlinkFirst(Node<E> f) {
// assert f == first && f != null;
final E element = f.item; // 保存即将删除元素的数据 返回用
final Node<E> next = f.next; // 即将删除元素的下一个
f.item = null; // 删除元素
f.next = null; // help GC
first = next; // 更新头加点
if (next == null) // 为空时
last = null;
else
next.prev = null;
size--;
modCount++;
return element;
} private E unlinkLast(Node<E> l) {
// assert l == last && l != null;
final E element = l.item;
final Node<E> prev = l.prev;
l.item = null;
l.prev = null; // help GC
last = prev;
if (prev == null)
first = null;
else
prev.next = null;
size--;
modCount++;
return element;
}

根据索引查找元素:此方法LinkedList做了优化,看代码

    // 获取指定索引的元素
public E get(int index) {
checkElementIndex(index);
return node(index).item;
} // 优化
Node<E> node(int index) {
// assert isElementIndex(index); if (index < (size >> 1)) { // 查找的索引小于 总个数的 1/2
Node<E> x = first;
for (int i = 0; i < index; i++) // 遍历到索引的位置
x = x.next;
return x;
} else { // 查找的索引大于 总个数的 1/2
Node<E> x = last;
for (int i = size - 1; i > index; i--) // 从尾到头遍历查找元素
x = x.prev;
return x;
}
}

在LinkedList的实现中我们可以看到,它利用元素的插入和删除,但是对于索引访问元素的操作,需要从头开始遍历,虽然做了微小的优化,但是还是不如数组实现的访问速度。

Vector:当我们在需要使用动态数组时,还有一个Vector可以满足我们的要求,它也是基于数组实现的有序集合,但是它与ArrayList的最大区别是Vector的所有方法都实现了同步,可以由两个线程安全的访问Vector对象,但是由一个线程访问Vector时,代码要在同步操作上耗费大量的时间。因为此性能较低,我们也不常用,在此不做讨论。

HashSet: 基于散列表的Set,Set中没有重复的元素,元素是否重复是基于散列码比较的,将元素散列在表的各个位置上,所以访问元素的顺序是随机的。适合不关心集合中元素的顺序时使用。

散列表:在java中使用的是链表数组实现的,每个列表叫做bucket,元素根据对象的散列码与bucket总数取余,决定元素的存储位置。如果bucket容量满时,将会出现hash冲突,性能下降,因此对于bucket总数的设置有学问,一般设置为预计插入元素个数的75%~150%,最好设置为素数,以防hash聚集。当我们设置的bucket总数小于预计插入元素时,此时会发生在散列,再散列就是创建一个数量更大的新的bucket,并将原bucket的数据复制过来,再弃用原bucket。何时进行在散列的判断,称为负载因子。java实现中默认为0.75.散列码(hashCode)是根据对象的内存地址转换而来的整数.

[集合]Collection集合框架源码分析

定义:

public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable { ...
}

构造方法与属性定义:

    // 底层基于HashMap实现
private transient HashMap<E,Object> map; private static final Object PRESENT = new Object(); public HashSet() {
map = new HashMap<>();
} // 根据传入的集合类,创建HashMap,如果元素的个数少于默认值,那么创建时指定为默认值,
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
} // 创建时指定容量和负载因子
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
} // 指定容量
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
} // 为包调用的构造函数,仅为实现类LinkedHashSet使用
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

HashSet中对元素的操作都是基于HashMap实现的,因此具体实现将在HashMap中详细介绍。

TreeSet:与HashSet类似,但是它是有序的Set,可以以任意顺序将数据插入到集合中,当我们遍历这个集合时,元素总是以排好的顺序输出。如名所示,TreeSet的排序使用树完成的(当前使用的是红黑树),根据特性可知,插入元素到TreeSet中比HashSet要慢,但是比数组实现的ArrayList和基于链表的LinkedList要快,TreeSet中元素比较是使用Comparable接口的comparator方法。实际应用中会根据实际需求是否需要对元素排序而在HashSet和TreeSet中选择。

定义:

    public class TreeSet<E> extends AbstractSet<E>
implements NavigableSet<E>, Cloneable, java.io.Serializable { ...
}

在TreeSet的定义中可以看到,它使用了 NavigableSet 接口,在这个接口中增加了几个便于定位元素和反向变遍历的方法。

构造函数与相关属性:通过构造方法不难看出,TreeSet的实现都是调用TreeMap实现的,同样,在后面再详细介绍。

    private transient NavigableMap<E,Object> m;

    TreeSet(NavigableMap<E,Object> m) {
this.m = m;
} public TreeSet() {
this(new TreeMap<E,Object>());
} public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<>(comparator));
} public TreeSet(Collection<? extends E> c) {
this();
addAll(c);
} public TreeSet(SortedSet<E> s) {
this(s.comparator());
addAll(s);
}

ArrayDeque:基于数组实现的双端队列

定义:

    public class ArrayDeque<E> extends AbstractCollection<E>
implements Deque<E>, Cloneable, Serializable { ...
}

构造函数与属性

    // 用于存放元素的 对象数组
transient Object[] elements; // 队头的下标
transient int head; // 队尾的下标
transient int tail; // 队列默认的容量
private static final int MIN_INITIAL_CAPACITY = 8; public ArrayDeque() {
elements = new Object[16];
} public ArrayDeque(int numElements) {
allocateElements(numElements);
} public ArrayDeque(Collection<? extends E> c) {
allocateElements(c.size());
addAll(c);
}

PriorityQueue:优先级队列。利用基于数组实现的堆的数据结构,元素的顺序和插入的顺序无关,而是和本身的优先级相关。与TreeSet类似,元素优先级的判断是根据实现了Comparable接口的comparator()方法判断的。对于元素的插入,利用二叉树的自调整 ,总是将自小的元素移动到根。而在元素删除的时候,总是删除数组最后的元素,也是数组优先级最大的元素。

Map接口

Map用来存放 key/value 对,可以可以根据提供的key,找到相应的value。其接口的定义如下 ():

public interface Map<K,V> {

        // 元素个数
int size(); // 是否为空
boolean isEmpty(); // 是否包含指定的key
boolean containsKey(Object key); // 是否包含指定的value
boolean containsValue(Object value); // 根据key 返回value
V get(Object key); // 加入一个键值对
V put(K key, V value); // 根据key,删除value
V remove(Object key); void putAll(Map<? extends K, ? extends V> m); // 清空map中的所有元素
void clear(); // 将map中的所有值包含在一个Set中返回,在此处该该Set的定义是视图,但是由Map支持,因此在Map中的修改和Set中的修改将是同步的,
Set<K> keySet(); // 同样的,返回map中所有的值,但是此时是放在集合对象中,同样修改也是相互影响的。多说一句,为什么键和值的返回类型不一样?
// 这个和Map的实现有关,在map中,键的存放和Set一样,也是基于hashCode的,而值的存储可以放在Collection中,可以基于数组实现。
Collection<V> values(); // 将Map中的元素包装为视图在Set中返回,其泛型是Entry,是Map的内部接口,其中定义了对Map的键值的相关操作方法,接口定义如下
Set<Map.Entry<K, V>> entrySet(); // 操作Map中键值的接口定义
interface Entry<K,V> { // 获取键
K getKey(); // 获取值
V getValue(); // 更新值操作
V setValue(V value); // 判断对象相等
boolean equals(Object o); // 散列码
int hashCode(); // 一下方法为jdk8 中的新特性 public static <K extends Comparable<? super K>, V> Comparator<Map.Entry<K,V>> comparingByKey() {
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> c1.getKey().compareTo(c2.getKey());
} public static <K, V extends Comparable<? super V>> Comparator<Map.Entry<K,V>> comparingByValue() {
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> c1.getValue().compareTo(c2.getValue());
} public static <K, V> Comparator<Map.Entry<K, V>> comparingByKey(Comparator<? super K> cmp) {
Objects.requireNonNull(cmp);
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> cmp.compare(c1.getKey(), c2.getKey());
} public static <K, V> Comparator<Map.Entry<K, V>> comparingByValue(Comparator<? super V> cmp) {
Objects.requireNonNull(cmp);
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> cmp.compare(c1.getValue(), c2.getValue());
}
} boolean equals(Object o); int hashCode(); // 一下为JDK8 中的新特性 default V getOrDefault(Object key, V defaultValue) {
V v;
return (((v = get(key)) != null) || containsKey(key))
? v
: defaultValue;
} default void forEach(BiConsumer<? super K, ? super V> action) {
Objects.requireNonNull(action);
for (Map.Entry<K, V> entry : entrySet()) {
K k;
V v;
try {
k = entry.getKey();
v = entry.getValue();
} catch(IllegalStateException ise) {
// this usually means the entry is no longer in the map.
throw new ConcurrentModificationException(ise);
}
action.accept(k, v);
}
} default void replaceAll(BiFunction<? super K, ? super V, ? extends V> function) {
Objects.requireNonNull(function);
for (Map.Entry<K, V> entry : entrySet()) {
K k;
V v;
try {
k = entry.getKey();
v = entry.getValue();
} catch(IllegalStateException ise) {
// this usually means the entry is no longer in the map.
throw new ConcurrentModificationException(ise);
} // ise thrown from function is not a cme.
v = function.apply(k, v); try {
entry.setValue(v);
} catch(IllegalStateException ise) {
// this usually means the entry is no longer in the map.
throw new ConcurrentModificationException(ise);
}
}
} default V putIfAbsent(K key, V value) {
V v = get(key);
if (v == null) {
v = put(key, value);
} return v;
} default boolean remove(Object key, Object value) {
Object curValue = get(key);
if (!Objects.equals(curValue, value) ||
(curValue == null && !containsKey(key))) {
return false;
}
remove(key);
return true;
} default boolean replace(K key, V oldValue, V newValue) {
Object curValue = get(key);
if (!Objects.equals(curValue, oldValue) ||
(curValue == null && !containsKey(key))) {
return false;
}
put(key, newValue);
return true;
} default V replace(K key, V value) {
V curValue;
if (((curValue = get(key)) != null) || containsKey(key)) {
curValue = put(key, value);
}
return curValue;
} default V computeIfAbsent(K key,
Function<? super K, ? extends V> mappingFunction) {
Objects.requireNonNull(mappingFunction);
V v;
if ((v = get(key)) == null) {
V newValue;
if ((newValue = mappingFunction.apply(key)) != null) {
put(key, newValue);
return newValue;
}
} return v;
} default V computeIfPresent(K key,
BiFunction<? super K, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
V oldValue;
if ((oldValue = get(key)) != null) {
V newValue = remappingFunction.apply(key, oldValue);
if (newValue != null) {
put(key, newValue);
return newValue;
} else {
remove(key);
return null;
}
} else {
return null;
}
} default V compute(K key,
BiFunction<? super K, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
V oldValue = get(key); V newValue = remappingFunction.apply(key, oldValue);
if (newValue == null) {
// delete mapping
if (oldValue != null || containsKey(key)) {
// something to remove
remove(key);
return null;
} else {
// nothing to do. Leave things as they were.
return null;
}
} else {
// add or replace old mapping
put(key, newValue);
return newValue;
}
} default V merge(K key, V value,
BiFunction<? super V, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
Objects.requireNonNull(value);
V oldValue = get(key);
V newValue = (oldValue == null) ? value :
remappingFunction.apply(oldValue, value);
if(newValue == null) {
remove(key);
} else {
put(key, newValue);
}
return newValue;
} }

[集合]Collection集合框架源码分析

Map具体的实现类:

[集合]Collection集合框架源码分析

HashMap: 采用数组+链表+红黑树实现,当链表的长度超过8 时,转而使用红黑树。

定义:

public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable { ...
}

构造函数及其属性:

    //  允许的最大容量
static final int MAXIMUM_CAPACITY = 1 << 30; // 默认的容量大小
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 // 将链表转为红黑树的阈值,当链表的个数大于8 时,转为红黑树
static final int TREEIFY_THRESHOLD = 8; // 红黑树转为链表
static final int UNTREEIFY_THRESHOLD = 6; // 红黑树的默认容量大小
static final int MIN_TREEIFY_CAPACITY = 64; // 负载因子,真实的元素个数占总容量的比例,超过后就会扩容
static final float DEFAULT_LOAD_FACTOR = 0.75f; // 传入容量大小和负载因子创建hashMap
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)// 容量小于0
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY) // 超出最大容量 那么容量就是 2^30
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor)) // 负载因子的合法性
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
} public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
} public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
} public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}

数据的封装:当我们将一个键值对放入hashmap的时候,键值对实际上被封装为一个Node,该Node实现了Map接口中的Entry,源码如下:

    static class Node<K,V> implements Map.Entry<K,V> {
final int hash; // 这个node对象的hash值
final K key; // 键
V value; // 值
Node<K,V> next; // 链表中的下一个 // 构造函数
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
} public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; } // hashCode的计算方法 ^异或运算:两个数转为二进制,然后从高位开始比较,如果相同则为0,不相同则为1。
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value); // 键 ^值
} // 更新Node对象的值
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
} // 判断存入的对象是否相等的方法 ,地址相同或者键值都相同返回true
public final boolean equals(Object o) {
if (o == this) // 比较地址
return true;
if (o instanceof Map.Entry) { // 比较键和值的equals方法
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}

数据的存放对象:

    // 存放数据的是Node类型的数组
transient Node<K,V>[] table; // hash表的负载因子
final float loadFactor; // 实际存放元素的个数,以此判断是否需要扩容 (threshold = capacity * loadFactor)
int threshold; // 修改次数
transient int modCount; // 键值对的数量
transient int size; // 保持缓存?
transient Set<Map.Entry<K,V>> entrySet;

放入一个键值对的操作:第一插入元素时对数组扩容,分配空间

    // 放入一个键值映射,
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true); // 如果键对应的值已经存在了,那么就替换旧值
} /**
* Implements Map.put and related methods
*
* @param hash hash for key 键的hash值 ,计算方法在Node中定义,看上面的Node源码
* @param key the key 键
* @param value the value to put 值
* @param onlyIfAbsent if true, don't change existing value 是否不改变已经存在的值
* @param evict if false, the table is in creation mode. 表的模式? false处于创建模式
* @return previous value, or null if none 返回该key对应的以前的值,如果没有,那么返回 null
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i; // tab为存放数据的数组, p 为根据 key 计算得到的数组下标对应的node,n为数组当前的长度,
if ((tab = table) == null || (n = tab.length) == 0) // 如果存放对象的 数组为空,或者长度为0
n = (tab = resize()).length; // 对数组进行第一次扩容, 这里说明hashmap 数组的初始化是在第一次放入元素时,而不是在创建的时候
if ((p = tab[i = (n - 1) & hash]) == null) // 数组的长度 n - 1 和 键的hash值 与运算得到数组下标,如果该值为空,直接放入,位与运算 & :两个数都转为二进制,然后从高位开始比较,如果两个数都为1则为1,否则为0。
tab[i] = newNode(hash, key, value, null);
else { // 如果不为空,那么放入链表?
Node<K,V> e; K k;
if (p.hash == hash && // 放入的元素和已有的元素 key hash相等且 equals返回true
((k = p.key) == key || (key != null && key.equals(k))))
e = p; // key相等时,e = 当前下标对应的元素。
else if (p instanceof TreeNode) // 如果是红黑树的节点,按照红黑树的方法插入
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else { // hash冲突的解决办法
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) { // e = 下标对应的元素的下一节点为null
p.next = newNode(hash, key, value, null); // 那么下一个就是等于新创建的节点 加入链表
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st // 当链表的长度大于等于 TREEIFY_THRESHOLD = 8,转而使用红黑树,注意有一个 -1的操作,也就是7的时候就转了。
treeifyBin(tab, hash); // 红黑树的操作
break;
}
if (e.hash == hash && // 创建的 key与 传入的key 相同
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e; // 插入链表
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null) // 根据参数判断是否替换
e.value = value;
afterNodeAccess(e); // 不替换,加入链表后面
return oldValue;
}
}
++modCount;
if (++size > threshold) // 判断是否需要扩容,
resize();
afterNodeInsertion(evict);
return null;
}

取出一个元素的操作:

    // 根据key取出元素
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
} final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 && // 检查数组有效性
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node // 第一个就相等
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode) // 是否为红黑树
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do { // 循环链表查找key对应的节点
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}

扩容机制:

    final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table; // 原来的数组
int oldCap = (oldTab == null) ? 0 : oldTab.length; // 原数组的容量
int oldThr = threshold; // 原来的扩容限制值
int newCap, newThr = 0;
if (oldCap > 0) { // 如果原来的容量大于0
if (oldCap >= MAXIMUM_CAPACITY) { // 如果原来的容量大于等于最大容量限制 2^30
threshold = Integer.MAX_VALUE; // 那么扩容限制设置为 最大值
return oldTab; // 返回原来的数组
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY) // 否则如果新容量为原来的两倍并且小于最大容量
newThr = oldThr << 1; // double threshold // 新的扩容限制也设为原来的两倍
}
else if (oldThr > 0) // initial capacity was placed in threshold // 如果原来的扩容限制大于0
newCap = oldThr; // 那么新的容量等于 原来的扩容限制
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY; // 否则新的容量设置为默认 16
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); // 新的扩容限制 newThr 等于 = 默认的加载因子 0.75f * 默认的容量 16
}
if (newThr == 0) { // 如果新扩容限制 = 0
float ft = (float)newCap * loadFactor; // 计算得到
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr; // 设置新的扩容限制
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; // 根据新的容量创建数组
table = newTab;
// 如果原来的数组不为空,那么需要将原来数组的数据复制到新数组
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null; // 置空,便于垃圾回收
if (e.next == null) // 如果为链表是,判断当前下标如果不再有元素
newTab[e.hash & (newCap - 1)] = e; // 放入的位置是该元素的hash 和 新的容量 - 1 与运算 的得到的下标
else if (e instanceof TreeNode) // 如果为红黑树的时候 ,
((TreeNode<K,V>)e).split(this, newTab, j, oldCap); // 红黑树拆分
else { // preserve order // 不为红黑树,但是当前数组的下标对应的链表中还有元素
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
// 循环复制链表中的元素到新数组
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}

遍历:HashMap有一个内部类EntrySet,其中定义了操作 map中数据的系列方法,我们的数据都是放在 Entry里面的。entrySet方法就是将Entry放在Set中返回了,我们再一次迭代该Set就完成了hashMap的遍历。

    public Set<Map.Entry<K,V>> entrySet() {
Set<Map.Entry<K,V>> es;
return (es = entrySet) == null ? (entrySet = new EntrySet()) : es;
} final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
public final int size() { return size; }
public final void clear() { HashMap.this.clear(); }
public final Iterator<Map.Entry<K,V>> iterator() {
return new EntryIterator();
}
public final boolean contains(Object o) {
if (!(o instanceof Map.Entry))
return false;
Map.Entry<?,?> e = (Map.Entry<?,?>) o;
Object key = e.getKey();
Node<K,V> candidate = getNode(hash(key), key);
return candidate != null && candidate.equals(e);
}
public final boolean remove(Object o) {
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>) o;
Object key = e.getKey();
Object value = e.getValue();
return removeNode(hash(key), key, value, true, true) != null;
}
return false;
}
public final Spliterator<Map.Entry<K,V>> spliterator() {
return new EntrySpliterator<>(HashMap.this, 0, -1, 0, 0);
}
public final void forEach(Consumer<? super Map.Entry<K,V>> action) {
Node<K,V>[] tab;
if (action == null)
throw new NullPointerException();
if (size > 0 && (tab = table) != null) {
int mc = modCount;
for (int i = 0; i < tab.length; ++i) {
for (Node<K,V> e = tab[i]; e != null; e = e.next)
action.accept(e);
}
if (modCount != mc)
throw new ConcurrentModificationException();
}
}
} final class EntryIterator extends HashIterator
implements Iterator<Map.Entry<K,V>> {
public final Map.Entry<K,V> next() { return nextNode(); }
}

WeakHashMap:

IdentityHashMap:

LinkedHashMap:

TreeMap:使用树构建的有序映射。排序的依据是Comparable接口。

SortedMap:

EnumMap:

HashTable:

最后附上一张整个集合框架的概览图:

[集合]Collection集合框架源码分析