数据结构——ArrayList的源码分析(你所有的疑问,都会被解答)

时间:2024-02-01 17:09:27

一.首先来看一下ArrayList的类图:

 

1,实现了RandomAccess接口,可以达到随机访问的效果。

2,实现了Serializable接口,可以用来序列化或者反序列化。

3,实现了List接口,是List的实现类之一

4,实现了Collection接口,是Collection家族的成员之一

5,实现了Iterable接口,代表可以对ArrayList进行For-each遍历。

二.然后咱们来看一下ArrayList的相关属性:

1,Long serialVersionUID = 8683452581122892189L,ArrayList序列化的版本ID

2,Int DEFAULT_CAPACITY = 10,默认的初始容量为10

3,Final Object[] EMPTY_ELEMENTDATA = {},用于空实例的共享空数组实例。(new ArrayList(0))

4,Final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {},用于提供默认大小的实例的共享空数组实例。(new ArrayList())

5,transient Object[] elementData。存储ArrayList的数组缓冲区,ArrayList的容量是数组的长度。

6,Int sizeArrayList中元素的数量。

 

.接着来看一下ArrayList的构造方法:

有参构造方法:很清晰的可以看出,如果initalCapacity>0,那么就创建一个新的长度为initalCapacityArrayList,如果initakCapacity=0,就用空实例的共享空数组实例EMPTY_ELEMENTDATA。其他情况就抛出非法请求。

 

无参构造方法:也可以很清晰的看出,如果用户不传入初始容量,那么ArrayList就会使将默认大小的实例的共享空数组实例赋值给elementData

带集合参数的构造方法:

这也是将集合转换为数组的一个方法。@param c,集合,代表集合中的元素都会被放到List当中。@throws 如果集合为空,就抛出空指针异常。为了防止c.toArray不正确的执行,导致没有返回一个Object[],进行了相关的特殊处理。如果数组的大小等于0的话,那么就将默认的数组空实例大小赋值给elementData

 

四.测试异常

那么为什么c.toArray会不返回一个Object[].class呢?来咱们写一些测试类,来测试一下。 

如果c.toArray一直会返回Object[].class,那么输出的结果都会是java.lang.Object。但是测试结果如下图。显然从测试结果上,可以看出java.util.ArrayList会返回一个Object对象,但是java.util.Arrays$ArrayList(Array的私有内部类ArrayList)却返回了String对象。这是为什么呢?

 

翻看ArrayListtoArray方法,会发现使用了Array.copyOf方法。

那么我们继续往下走,看一下这个copyOf方法已经该方法的具体实现形式。

 

通过这个三元运算符,也能够看出这一个复制的逻辑。如果newTypeObject类型的话,那么就返回数组的类型为Object,如果不是的话,就是newType类型的。而我们在ArrayListtoArray方法里面放入的elementData前面已经讲解过是Object类型的,所以ArrayList必然就是一个Object类型。

 

看完ArrayList内部的toArray源码之后,我们来看一下Array中的内部ArrayList的源码:

只截取了部分源码,可以看出内置的ArrayList是直接把接收到的数组赋值给a,然后通过toArray方法,直接把a的克隆返回,而这是传入的数据是什么类型,返回的就是什么类型。所以,在我们上面的例子中,实际上返回的是String类型的数组,再将其中的元素赋值成Object类型的,自然报错。

 

好,看完了ArrayList的属性和构造方法,咱们来看一下ArrayList的相关方法。

五.添加元素

在列表的最后添加元素,同时在父类中的abstractList中有记录modCount属性,用来记录数组修改的次数。

在指定位置添加指定的元素:

Index代表插入元素的位置,如果当前位置已经有了元素的话,那么就将该元素和元素后面的所有元素向后移一位,可能会抛出IndexOutOfBoundsException。这时候就需要考虑扩容了。

 

而这两个插入的方法还需要调用一些相关的私有方法。去计算当然的容量,保证ArrayList的容量健康,源码放下面了,因为比较简单,就不多说啦。

 

六.扩容机制

添加方法自然和扩容是分不开的。ArrayList自然也是有一套非常完善的扩容机制的,先前不是说了吗,如果在添加元素的时候容量不足,自然就需要扩容了。

1,MAX_ARRAY_SIZE代表了整个数组最大可以分配到的size,一些虚拟机再数组中预留了一些headerwords,如果想要尝试分配更大的size,很有可能会报OOM的错误。

2,minCapacity:期望的最小容量,所以扩容一定要比这个数大。

3,最大容量返回Inter.MAX_VALUE

正常情况下,新容量是原来容量的1.5倍,如果原容量的1.5倍比minCapacity小,那么就扩容到minCapacity,特殊情况扩容到Inter.MAX_VALUE

这也就解释了为什么为什么空实例默认数组有的时候是EMPTY_ELEMENTDATA,而又有的时候是DEFAULTCAPACITY_EMPTY_ELEMENTDATA。New ArrayList()会将elementData赋值为DEFAULTCAPACITY_EMPTY_ELEMENTDATAnew ArrayLIst(0),会将elementData赋值为EMPTY_ELEMENTDATA。后者添加元素会扩容到容量为1,前者扩容之后容量为10

 

 七.删除的方法

删除指定下面元素的方法

1,index:删除的指定下标

2,下标越界会抛出IndexOutOfBoundsException

 

删除指定元素的方法

如果存在,那么删除返回true,否则的话返回falseo表示指定的元素

 

私有的移除方法:

私有的删除方法,跳过边界检查且不返回移除的元素。

 

 

 

八.查找的方法

查找指定元素所在的位置

查找指定位置的元素

这个方法直接返回elementData数组指定下标的元素,效率还是很高的,所以ArrayListfor循环遍历的效率还是很高的。

九.序列化方法

ArrayList是可以序列化和反序列化的,具体实现的方法如下:

ArrayList的实例的状态保存到一个流里面。

 

 

 

根据一个流重新生成一个ArrayList。根据序列化的方法可以看出,elementData之所以用transient修饰,是因为JDK不想将整个elementData都序列化或者反序列化,而只是将size和实际存储的元素进行序列化或者反序列化,从而节省空间和时间。

 

 

 

十.创建子数组

SubListset()方法,是直接修改ArrayList中的elementData数组的,所以在使用的时候一定要注意,同时SubList是没有实现Serializable接口的,所以是不能序列化的。

 

 

十一.迭代器

创建迭代器的方法,和Itr相关属性,hasNext()方法和next方法,cursor表示下一个要返回的元素的下标,lastRet表示最后一个元素的下标,没有元素返回-1expectedModCount表示期望的count

 

在迭代的时候,会检验modCount是否等于expectedModCount,不等于的话就会抛出著名的ConcurrentModificationException异常。