ThreadLocal的设计与使用(原理篇)

时间:2021-11-25 17:07:01

在jdk1.2推出时开始支持java.lang.ThreadLocal。在J2SE5.0中的声明为:

 
         public class ThreadLocal<T> extends Object
 
      ThreadLocal是什么呢?其实ThreadLocal并非是一个线程的本地实现版本,它并不是一个Thread,而是thread local variable(线程局部变量)。也许把它命名为ThreadLocalVar更加合适。线程局部变量(ThreadLocal)其实的功用非常简单,就是为每一个使用该变量的线程都提供一个变量值的副本,是每一个线程都可以独立地改变自己的副本,而不会和其它线程的副本冲突。从线程的角度看,就好像每一个线程都完全拥有该变量。
 
      首先我们看一下ThreadLocal类的接口和设计思路。在J2SE5.0中,该类有1个默认构造函数,4个普通函数:
      protected ThreadLocal initialValue(),显然是为了子类重写而特意实现的。该方法返回当前线程在该线程局部变量的初始值,这个方法是一个延迟调用方法,在一个线程第1次调用get()或者set(Object)时才执行,并且仅执行1次;public ThreadLocal get(),返回当前线程的线程局部变量副本;public void set(ThreadLocal value),设置当前线程的线程局部变量副本的值;public void remove(),移除当前线程的线程局部变量副本的值以释放存储空间。
 
      从下面这个参考实现,我们可以看出ThreadLocal的工作原理:

public class ThreadLocal { 
  private Map values = Collections.synchronizedMap(new HashMap());

public Object get() {
    Thread curThread = Thread.currentThread();
    Object o = values.get(curThread);
    if (o == null && !values.containsKey(curThread)) {
      o = initialValue();
      values.put(curThread, o);
    }
    return o;
  }

public void set(Object newValue) {
    values.put(Thread.currentThread(), newValue);
  }

public Object initialValue() {
    return null;
  }
}

 
      JDK中的ThreadLocal的实现总体思路也类似于此,但这并不是一个工业强度的实现。首先,每个 get() 和 set() 操作都需要values 映射表上的同步,而且如果多个线程同时访问同一个ThreadLocal,那么将发生冲突。此外,这个实现也是不切实际的,因为用Thread 对象做 values 映射表中的key将导致无法在线程退出后对 Thread 进行垃圾回收,而且也无法对死线程的 ThreadLocal的特定于线程的值进行垃圾回收。从j2sdk5.0的src来看,并非在ThreadLocal中有一个Map,而是在每个Thread中存在这样一个Map,具体是ThreadLocal.ThreadLocalMap。当用set时候,往当前线程里面的Map里 put 的key是当前的ThreadLocal对象。而不是把当前Thread作为Key值put到ThreadLocal中的Map里。
 
      ThreadLocal的使用。如果希望线程局部变量初始化其它值,那么需要自己实现ThreadLocal的子类并重写该方法,通常使用一个inner anonymous class对ThreadLocal进行子类化,比如下面的例子,SerialNum类为每一个类分配一个序号:

public class SerialNum {
     // The next serial number to be assigned
     private static int nextSerialNum = 0;

private static ThreadLocal serialNum = new ThreadLocal() {
         protected synchronized Object initialValue() {
             return new Integer(nextSerialNum++);
         }
     };

public static int get() {
         return ((Integer) (serialNum.get())).intValue();
     }
}

      在线程是活动的并且ThreadLocal对象是可访问的时,该线程就持有一个到该线程局部变量副本的隐含引用,当该线程运行结束后,该线程拥有的所有线程局部变量的副本都将失效,并等待垃圾收集器收集。
  由于ThreadLocal中可以持有任何类型的对象,所以使用ThreadLocal获取当前线程的值是需要进行强制类型转换。但随着J2SE5.0将模版引入,新的支持模版参数的ThreadLocal<T>类将从中受益。也可以减少强制类型转换,并将一些错误检查提前到了编译期,将一定程度地简化ThreadLocal的使用。
 
  ThreadLocal和其它同步机制相比有什么优势呢?ThreadLocal和其它所有的同步机制都是为了解决多线程中的对同一变量的访问冲突,在普通的同步机制中,是通过对象加锁来实现多个线 程对同一变量的安全访问的。这时该变量是多个线程共享的,使用这种同步机制需要很细致地分析在什么时候对变量进行读写,什么时候需要锁定某个对象,什么时候释放该对象的锁等等很多。所有这些都是因为多个线程共享了资源造成的。ThreadLocal就从另一个角度来解决多线程的并发访问,ThreadLocal会为每一个线程维护一个和该线程绑定的变量的副本,从而隔离了多个线程的数据,每一个线程都拥有自己的变量副本,从而也就没有必要对该变量进行同步了。ThreadLocal提供了线程安全的共享对象,在编写多线程代码时,可以把不安全的整个变量封装进ThreadLocal,或者把该对象的特定于线程的状态封装进ThreadLocal
  当然ThreadLocal并不能替代同步机制,两者面向的问题领域不同。同步机制是为了同步多个线程对相同资源的并发访问,是为了多个线程之间进行通信的有效方式;而ThreadLocal是隔离多个线程的数据共享,从根本上就不在多个线程之间共享资源(变量),这样当然不需要对多个线程进行同步了。所以,如果你需要进行多个线程之间进行通信,则使用同步机制;如果需要隔离多个线程之间的共享冲突,可以使用ThreadLocal,这将极大地简化我们的程序,使程序更加易读、简洁。