Java内存模型
Java内存模型(Java Memory Model,JMM)就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了Java程序在各种平台下对内存的访问都能保证效果一致的机制及规范。
简要言之,jmm是jvm的一种规范,定义了jvm的内存模型。它屏蔽了各种硬件和操作系统的访问差异,不像c那样直接访问硬件内存,相对安全很多,
它的主要目的是解决由于多线程通过共享内存进行通信时,存在的本地内存数据不一致、编译器会对代码指令重排序、处理器会对代码乱序执行等带来的问题,
可以保证并发编程场景中的原子性、可见性和有序性。
原子性:每一种操作都是原子的、不可再分的
可见性:是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更,JMM规定了所有的变量都存储在主内存中。
有序性:支持指令重排。
这里对有序性进行详细讲解
什么是有序性?
对于一个线程的执行代码而言,我们总是习惯认为代码的执行总是从上到下,有序执行。 但为了提升性能,编译器和处理器通常会对指令序列进行 重新排序。Java规范规定JVM线程内部维持顺序化语义,即只要程序的最终结果与它顺序化执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序。
有序性的优缺点
JVM能根据处理器特性(CPU多级缓存系统、多核处理器等)适当的对机器指令进行重排序,使机器指令能更符合CPU的执行特性,最大限度的发挥机器性能。 但是指令重排可以保证串行语义一致,但没有义务保证多线程间的语义也一致(即可能产生"脏读"),简单说,两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化。
单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。
处理器在进行重排序时必须要考虑指令之间的数据依赖性。
多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测。
Java内存模型规定所有的变量都存储在主内存中,每条线程还有自己的工作内存, 线程的工作内存中保存了被该线程使用到的变量的主内存副本的拷贝,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行, 而不能直接读写主内存中的变量。不同的线程之间也无法访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。
主内存:主要对应Java堆中的对象实例数据部分。(寄存器,高速缓存)
工作内存:对应于虚拟机栈中的部分区域。(硬件的内存)
关于主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存这一类的实现细节。Java虚拟机实现时必须保证下面提及的每一种操作都是原子的、不可再分的:
Lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
unLock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程所定。
Read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的 load动作使用。
Load(载入):作用于工作内存的变量,它把 read操作从主内存中得到的变量值放入工作内存的变量副本中。
Use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
Assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收的值符给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
Store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。
Write(写入):作用于主内存的变量,它把 store 操作从工作内存中得到的变量的值放入主内存的变量中。
- 如果对一个变量执行lock操作,将会清空工作内存中此变量的值;
- 对一个变量执行 unlock 操作之前,必须先把此变量同步到主内存中。
内存屏障(Memory Barrier)
硬件层的内存屏障分为两种:Load Barrier和Store Barrier即读屏障和写屏障(内存屏障是硬件层的)。
为什么需要内存屏障
由于现代操作系统都是多处理器操作系统,每个处理器都会有自己的缓存,可能存在不同处理器缓存不一致的问题, 而且由于操作系统可能存在重排序,导致读取到错误的数据,因此操作系统提供了一些内存屏障以解决这种问题。
简单来说:
在不同CPU执行的不同线程对同一个变量的缓存值不同
用volatile可以解决上面的问题,不同硬件对内存屏障的实现方式不一样。java屏蔽掉这些差异,通过jvm生成内存屏障的指令。 对于读屏障:在指令前插入读屏障,可以让高速缓存中的数据失效,强制从主内存取。
内存屏障的作用
cpu执行指令可能是无序的,它有两个比较重要的作用
- 阻止屏障两侧指令重排序
- 强制把写缓冲区/高速缓存中的脏数据等写回主内存,让缓存中相应的数据失效。
volatile型变量
当我们声明某个变量为volatile修饰时,这个变量就有了线程可见性,volatile通过在读写操作前后添加内存屏障。
volatile型变量拥有如下特性
- 可见性,对于一个该变量的读,一定能看到读之前最后的写入。
- 防止指令重排序,执行代码时,为了提高执行效率,会在不影响最后结果的前提下对指令进行重新排序,使用volatile可以防止, 比如单例模式双重校验锁的创建中有使用到
注意的是volatile不具有原子性
至于volatile底层是怎么实现保证不同线程可见性的,这里涉及到的就是硬件上的, 被volatile修饰的变量在进行写操作时,会生成一个特殊的汇编指令,该指令会触发mesi协议, 会存在一个总线嗅探机制的东西,简单来说就是这个cpu会不停检测总线中该变量的变化, 如果该变量一旦变化了,由于这个嗅探机制,其它cpu会立马将该变量的cpu缓存数据清空掉, 重新的去从主内存拿到这个数据。
多线程先行发生原则之happens-before
Java语言中JMM原则下有一个“先行发生”(happens-before)的原则,这个原则非常重要:
它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规矩一揽子解决并发环境下两个操作之间是否可能存在冲突的所有问题,而不需要陷入Java内存模型苦涩难懂的底层编译原理之中。
在JMM中,如果一个操作执行的结果需要对另一个操作可见性 或者 代码重排序,那么这两个操作之间必须存在 happens-before(先行发生)原则
happens-before原则简而言之就是:
如果一个操作先行发生于另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行结果顺序排在第二个操作之前。
两个操作之间存在happens-before关系,并不意味着一定要按照happens-before原则制定的顺序来执行。如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种排序并不非法。
happens-before有以下八条原则:
次序规则:一个线程内,按照代码的顺序,写在前面的操作先行发生于写在后面的操作
锁定规则:一个unLock操作先行发生于后面(“后面”是指时间上的先后)对同一个锁的lock操作
volatile变量规则:对一个volatile变量的写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的(“后面”是指时间上的先后)
传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作
线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断时间的发生,即先调用interrupt()方法设置过中断标志位,才能通过Thread.interrupted()检测到是否发生中断。
线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过isAlive()等手段检测线程是否已经终止执行。
对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始。