[改善Java代码]枚举项的数量限制在64个以内

为了更好的使用枚举,Java提供了两个枚举集合:EnumSet和EnumMap,这两个集合的使用方法都比较简单,EnumSet表示其元素必须是某一枚举的枚举项,EnumMap表示Key值必须是某一枚举的枚举项,由于枚举类型的实例数量固定并且有限,相对来说,EnumSet和EnumMap的效率会比其他Set和Map要高.

虽然EnumSret很好用,但是它有一个隐藏的特点.项目中可能定义非常多的枚举项,然后通过EnumSet访问,遍历,但它对不同的枚举数量有不同的处理方式.为了进行对比,我们定义两个枚举,一个数量等于64,一个是65(大于64即可,为什么是64而不是128,512呢?)代码如下:

 import java.util.EnumSet;

 public class Client {

     public static void main(String[] args) {

         //创建生成包含所有枚举项的EnumSet

         EnumSet<Const> cs = EnumSet.allOf(Const.class);

         EnumSet<LargeConst> lcs = EnumSet.allOf(LargeConst.class);

         //打印出枚举项数量

         System.out.println("Const枚举项数量：" + cs.size());

         System.out.println("LargeConst枚举项数量：" + lcs.size());

         //输出两个EnumSet的class

         System.out.println(cs.getClass());

         System.out.println(lcs.getClass());

     }

 }

 //普通枚举项，数量小于64

 enum Const {

     A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, AA, BA, CA, DA, EA, FA, GA, HA, NA, OA, PA, QA, RA, SA, TA, UA, VA, WA, XA, YA, ZA, BC, CC, DC, EC, FC, GC, HC, IC, JC, KC, LC, MC, NC, OC, PC, QC, RC;

 }

 //大枚举，数量超过64

 enum LargeConst {

     A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, AA, BA, CA, DA, EA, FA, GA, HA, IA, JA, KA, LA, MA, NA, OA, PA, QA, RA, SA, TA, UA, VA, WA, XA, YA, ZA, AB, BB, CB, DB, EB, FB, GB, HB, IB, JB, KB, LB, MB;

 }

Const中的枚举项数量是64,LargeConst的数量是65,上面的代码让他们转换成EnumSet,然后判断一下它们的class类型是否相同.

运行结果:

Const枚举项数量：64

LargeConst枚举项数量：65

class java.util.RegularEnumSet

class java.util.JumboEnumSet

很遗憾,两者不相等,就差1个元素,两者就不相同了,这也是我们要重点关注枚举项数量的原因,通过源码看Java是如何处理的?首先跟踪allOf方法,其源代码如下:

     /**

      * Creates an enum set containing all of the elements in the specified

      * element type.

      *

      * @param elementType the class object of the element type for this enum

      *     set

      * @throws NullPointerException if <tt>elementType</tt> is null

      */

     public static <E extends Enum<E>> EnumSet<E> allOf(Class<E> elementType) {

         EnumSet<E> result = noneOf(elementType);//生成一个空的EnumSet

         result.addAll();..加入所有的枚举项

         return result;

     }

allOff通过noneOf方法首先生成一个EnumSet对象,然后把所有的枚举项都加进去,问题可能就出现在EnumSet的生成上了.查看noneOf的代码.

     /**

      * Creates an empty enum set with the specified element type.

      *

      * @param elementType the class object of the element type for this enum

      *     set

      * @throws NullPointerException if <tt>elementType</tt> is null

      */

     public static <E extends Enum<E>> EnumSet<E> noneOf(Class<E> elementType) {

         Enum[] universe = getUniverse(elementType);

         if (universe == null)

             throw new ClassCastException(elementType + " not an enum");

         if (universe.length <= 64) //枚举数量小于64

             return new RegularEnumSet<>(elementType, universe);

         else //枚举数量大于64

             return new JumboEnumSet<>(elementType, universe);

     }

当枚举数量小于64的时候,创建一个RegularEnumSet实例对象,大于64时则创建一个JumboEnumSet实例对象.

为什么要这么处理?这还要看着两个类之间的差异.

RegularEnumSet类,代码如下:

 class RegularEnumSet<E extends Enum<E>> extends EnumSet<E> {

     private long elements = 0L;//记录所有枚举排序号,注意是long型

     RegularEnumSet(Class<E>elementType, Enum[] universe) {//构造函数

         super(elementType, universe);

     }

     void addAll() {//加入所有元素

         if (universe.length != 0)

             elements = -1L >>> -universe.length;

     }

 }

枚举项的排序值ordinal是从0,1,2,......依次递增的,没有重号,没有跳号,RegularEnumSet就是利用这一点把每个枚举项的ordinal映射到一个long类型的每个位上的,

注意看addAll方法的elements元素,它使用了无符号右移操作,符号位为0,并补充地位,简单的说,Java把一个不多于64个枚举项的枚举映射到了一个long类型变量上,这才是EnumSet处理的重点,其他的size方法,constains方法都是根据elements计算出来的,

一个long类型的数字包含了所有的枚举项,其效率和性能肯定都是非常优秀的.

long类型是64位的,所以RegularEnumSet类型也就只能负责枚举项数量,不大于64的枚举,大于64则由JumboEnumSet处理,看其源代码:

class JumboEnumSet<E extends Enum<E>> extends EnumSet<E> {

    private long elements[];//映射所有的枚举项

    JumboEnumSet(Class<E>elementType, Enum[] universe) {//构造函数

        super(elementType, universe);

        elements = new long[(universe.length + 63) >>> 6];//默认长度是枚举项数量除以64再加1

    }

    void addAll() {//elements中每个元素表示64个枚举项

        for (int i = 0; i < elements.length; i++)

            elements[i] = -1;

        elements[elements.length - 1] >>>= -universe.length;

        size = universe.length;

    }

}

JumboEnumSet类把枚举项按照64个元素一组拆分了多组,每组都映射到一个long类型的数字上,然后该数组再放置到elements数组中,简单来说JumboEnumSet类的原理与RegularEnumset相似,只是JumboEnumSet使用了long数组能容纳更多的枚举项.

在我们的开发中很少用到位操作.RegularEnumSet是把每个枚举项编码映射到了一个long类型数字的每个位上.JumboEnumSet是先按照64个一组进行拆分,然后每个组再映射到一个long类型数字的每个位上.从这里可以看出数字编码的奥秘.

EnumSet提供的两个实现都是基本的数字类型操作,其性能肯定比其他的Set类型要好很多,特别是Enum的数量少于64的时候.简直非一般的速度.