总结:Java 集合进阶精讲2-ArrayList

时间:2023-12-24 12:21:01

知识点:Java 集合框架图

总结:Java 集合进阶精讲1

总结:Java 集合进阶精讲2-ArrayList

初探:

  • ArrayList底层结构是数组,是List接口的 可变数组的实现,所以会占用一块连续的内存空间。
  • 每个ArrayList实例都有一个容量,该容量是指用来存储列表元素的数组的大小,可以动态增长。

自动增长会带来数据向新数组的重新拷贝,因此,如果可预知数据量的大小,就可在构造ArrayList实例时指定其容量。

  • 线程不安全,允许元素为null。ArrayList继承自 AbstractList<E>,实现了List<E>, RandomAccess, Cloneable, java.io.Serializable 接口。

实现了RandomAccess 代表List获取了随机访问功能,也就是通过下标获取元素对象的功能,表明可以实现快速随机访问。

实现了Cloneable接口的实现表示该容器具有Clone函数操作,Serializable是序列化。

扩展

Integer.MAX_VALUE - 8 这里为什么要减去8?

从jdk1.7开始,考虑到不同的JVM,有的VM会在加入一些数据头

当扩容后的容量大于MAX_ARRAY_SIZE,我们会去比较最小需要容量和MAX_ARRAY_SIZE做比较,如果比它大, 只能取Integer.MAX_VALUE,否则是Integer.MAX_VALUE -8。

jdk1.8的无参构造函数和之前版本的构造函数有什么区别?
jdk1.6

public ArrayList() {
this(10);
} jdk1.7
public ArrayList() {
super();
this.elementData = EMPTY_ELEMENTDATA;
} jdk1.8
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

对比下可以看出:

jdk1.6的无参构造方法构造的ArrayList的底层数组elementData大小(容量)默认为10

而从1.7开始elementData大小默认为0。

在jdk1.7版本java集合类基本上都有一种改动:懒初始化。懒初始化指的是默认构造方法构造的集合类,占据尽可能少的内存空间(不使用null是为了避免null判断),在第一次进行包含有添加语义的操作时,才进行真正的初始化工作。

1.7开始的ArrayList,默认构造方法构造的实例,底层数组是空数组,容量为0,在进行第一次add/addAll等操作时才会真正给底层数组赋非empty的值。如果add/addAll添加的元素小于10,则把elementData数组扩容为10个元素大小,否则使用刚好合适的大小

1.8版本,默认构造的实例这个行为没有改变,只是用的数组名字变了。

jdk1.6中扩容算法的缺陷

(jdk1.7和jdk1.8在扩容算法方面差别不大)

jdk1.6
public void ensureCapacity(int minCapacity) {
modCount++;
int oldCapacity = elementData.length;
if (minCapacity > oldCapacity) {
Object oldData[] = elementData;
int newCapacity = (oldCapacity * 3)/2 + 1;
if (newCapacity < minCapacity)
newCapacity = minCapacity;
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
}

从上面的代码可以看出jdk1.6的ensureCapacity方法只是简单进行了逻辑上的操作,没有过多考虑int型溢出的问题,从1.7开始对这个进行了完善。

而且没考虑入参minCapacity可能因为int溢出变为负数。这个方法可以外部手动调用,手动扩容传入负数这个肯定是应该拦截掉的。但是自动扩容会因为int溢出产生负数,碰到这种情况时应该特殊处理,而不是什么都不做,等着后面抛出一个ArrayIndexOutOfBoundsException。

下面代码会造成过早溢出

int newCapacity = (oldCapacity * 3)/2 + 1;

虽然上面这行代码和1.7开始的oldCapacity + (oldCapacity >> 1) 差不多,都是相当于1.5倍,但实际上是有 区别的。

两个区别

第一:jdk1.6的乘除运算的数学结果比后面一个大1

比如oldCapacity=10,1.6的 算法得到16,1.7开始的算法得到15,这个影响不大;

第二:两者在数字比较大时运算结果不一样

比如 oldCapacity=10^9,这个数和Integer.MAX_VALUE位数一样,用1.6的算法得到的会是错误的-647483647,用 1.7的则是正确的1500000000,这时候明明可以1.5倍扩容,但是jdk1.6却用的是按需扩容。

ensureCapacity(称之为手动,是因为此方法是public的,可以外部手动调用)。

从1.7开始将内部扩容和外部可以调用的扩容方法分开了,通过源码可以看出:外部调用的手动扩容方法ensureCapacity要多一个判断条件 minCapacity > minExpand,这个判断条件拦截掉负数的minCapacity,这样调用内部扩容ensureCapacityInternal方法时,minCapacity一定是正数;内部扩容方法直接就用minCapacity - elementData.length > 0判断,此条件可以检测出int型溢出,碰到溢出最后会抛出一个OOM错误。

jdk1.7用OOM,这比jdk1.6用ArrayIndexOutOfBoundsException更好,因为此时数组大小超出了虚拟机对数组的限制,虚拟机无法处理这种情况了,抛出一个ERROR是合理的。

使用这行代码

newCapacity = oldCapacity + (oldCapacity >> 1);

使用位运算加快执行速度,更重要的是避免过早出现int溢出的情况,保证了内部自动扩容会尽量按规定的策略执行。同时整个扩容处理流程中多增加了几处if判断,对各种情况处理更加完善。

为什么ArrayList自动容量扩充选择扩充1.5倍?

这种算法构造出来的新的数组长度的增量都会比上一次大( 而且是越来越大) ,避免频繁newInstance 的情况。

为什么ArrayList 不适合频繁插入和删除操作?

在ArrayList中经常会调用 System.arraycopy 这个效率很低的操作来复制数组,所以导致ArrayList在插入和删除操作中效率不高。