读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

时间:2021-03-11 20:56:26

       首先,看到这一张的内容时看见了一个协议,MESI协议,这个协议涉及到处理器的内存与缓存相关的知识,因此就先去了解了一下处理器的知识,java虚拟机的模型其实和处理器可以类比,看看没有坏处。

百度了大段的博客,发现大家写的都是参考的一本书,《大话处理器》,也去下载了一本,其他内容没兴趣,直接去第5张找有关缓存的知识。。。。

一.Cache的层次

书中提到,现今的处理器都是采用的多级的Cache组织形式,来达到性能和功耗的最优。

单核处理器的Cache结构如下图所示:单核处理器一般是两级Cache:L1 Cache 和L2Cache ,L1P表示的是程序缓存(Program),L1D表示的是数据缓存(Data),而L2则是程序和数据共用一套缓存,一般L2会比L1大,因此,当内核需要访问程序或者数据时,会先从L1去取,如果L1中没有,则L1从L2中将数据导入,如果L2中也没有,则L2从内存中将数据导入。

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

多核处理器的Cahce构造如下:多核处理器意味着每个核都有自己的一套缓存,L3书中介绍是每个核共享的另外一个大容量的缓存

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

其实看到多核处理器的模型时就应该能发现了,Core0和Core1有自己的缓存数据,就意味着每个处理器都不一定能读取到最新的数据,有可能Core0读取时数据是0,Core1读取到的数据也是0,但是Core0将数据更新为1,Core1也将数据更新为1,按理说,更新操作执行了两次,数据应该更新为2,但是最终的数据确实1,这就是问题,当然,这是后话,笔者读到这边时,想到了这些,顺便啰嗦一下。

二.Cache的映射方式

笔者对于底层的这些理解不是很好,只不过学习了书中别人的观点。

了解Cache的映射方式,就要先了解Cache的结构,整个Cache空间被分成了N个line,每个line通常都是32byte、64byte等,Cache line是Cache和内存交换数据的最小单位,它的结构如下图:

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

这个是最少的部分,也就是说每个Cache line最少也应该有3个部分,有时候会多出一些标志位,后话。

看下结构内的数据,block中存储的是内存在Cache中缓存的数据,tag中存储的是该Cache line对应的内存块的地址,valid表示该Cache line中的数据是否有效。

当内核访问Cache内的数据,并且找到了,就称之为 Cache hit,反之就是Cache miss,关键名词也是要熟悉,不然不专业啊^_^。

接下来去看映射方式----------------------------------------------------------------------------------------------------------------------------------------------------

1.全关联Cache。在全关联Cache中,内存中每个line能够被映射到Cache中的任意一个Cache line,如果Cache line有A个,内存大小有B个,那么就有A*B中组合方式,可见映射种类很多,很复杂,这种情况下,如果去判断一个数据是不是在Cache中,需要将地址和所有Cache Line进行匹配,成本很高,实际的处理器中,这种方式很少见。映射方式见下图:

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

在本篇里,暂不去讨论Cache中的缓存的大小计算,不是本篇的重点,这个还是有兴趣的,在后续博客中再来分析一下,一时间资料很少,百家争鸣,自己也不能把握。

2.直接映射Cache。与全关联不一样的点在于 将内存按照Cache的大小分成了N个Page,每个Page和Cache大小相同,因此Page中的line 0 映射到Cache中的line 0,不难理解。

其实就是以下公式: 内存存放块号 =  内存块号%Cache总行数。N个page循环插入到Cache 的line 0  ~~ line n中。

3.组关联Cache,组关联将Cache分成 多个way(份),当内存中的数据需要放入到Cache时,如果 way0的line 0倍占用,那么就会放入到way1的line 0中,图就不化了,不难理解。

最后由个置换策略,置换策略常用的有:

1.随机

2.FIFO

3.LRU(最近最少使用)

看效果其实就是LRU被用的多。

以上就是Cache的映射方式,这个知识点不是本章重点,所以笔者也只是去了解一下相关的知识点,笔者想要知道的是Cache的写方式,写方式就是多线程内比较关心的。

三.Cache的写方式

Cache提供了两种写策略,写通(write through)和写回(write back)

所谓write through 其实就是每次CPU修改了Cache的值,会立即更新内存的内容。

所谓write back就是内核修改Cache的内容后,Cache并不会立即更新内存中的内容,而是等到这个Cache line因为某种原因需要从Cache中移除时,Cache才更新内存中的数据。例如Cache 的line0中存放的值为 x=3,内核这个时候如果想修改x的值,那么它修改的其实是Cache中 的 x =5,但是由于并不会立马更新进内存,所以内存中x = 3,此时Cache中的line0 需要被替换了,有新的值需要存放,因此这个时候Cache会先将Cache line0的内容也就是x=3更新到内存中,然后保存新的数据。因此一般处理器都是采用write back的策略。

那么问题来了~~~Cache怎么知道这行的数据有没有被修改呢?就需要一个标志,dirty,dirty为1,说明Cache的内容被修改了,和内存不一致,当该Cache line被移除时,数据写回内存时,dirty位为0(clean),标识内容一致。这边的Cache只是针对数据Cache,程序Cache不会被修改,所以没有这个标志位

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

四.Cache一致性问题。

在上面我们可以看见增加了标志位来说明这个Cache的数据是否是干净的,还是无效的。这其实就是Cache一致性问题。为了保证Cache的一致性,处理器提供了两个保证 Cache一致性的底层操作:writeinvaliddate和write update。

writeinvaliddate(置无效),当一个内核修改了一份数据,其他内核如果有这份数据的复制,就置成无效(invalid)。

write update(写更新),当一个内核修改了一份数据,其他地方如果有这份数据的复制,就更新到最新值。

writeinvaliddate操作如下图:

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

write update 操作如下图:

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

对于writeinvaliddate操作来说的话,最好的情况下是core1和core2以后都不再使用变量x,但是这种操作会带来一个问题,那就是当valid标志位标志成invalid后,这个Cache中其他本来有效的数据都不能再被使用了。但是呢,write update操作的话又会产生大量的数据更新操作,因此由于writeinvaliddate简单,大多数处理器采用的还是writeinvaliddate策略。


那我们直接来看writeinvaliddate操作吧,writeinvaliddate操作提供了实现Cache一致性的简单思想,处理器上有一套完整的协议来保证Cache一致性,比较经典的就是MESI协议,这也是我写这篇博客的主要关注点,MESI协议。

前面关于Cache中的两个标志dirty和valid,就是描述的Cache和Memory之间的数据关系(数据是否有效,数据是否被修改)。

在MESI协议中,每个Cache line有4个状态 ,用2 bit表示(没求证过)

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

解读上面的解释需要和内存模型一起来理解,M/E状态下的Cache line,数据是独有的,不同点在于M状态下的数据是dirty的,E状态下的数据是clean的。

S状态的Cache line,数据和其他的Cache共享,也只有clean的的数据才能被多个Cache共享,否则就出现了数据一致性问题了。

I状态下的Cache line表示无效。

E状态如下,只有Core0访问时,它的状态为E

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

S状态如下,S状态说明有多个Cache读取了这个数据

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

M和I状态不再去画图,上面已经给出。

在MESI协议中,每个Cache的Cache控制器不仅知道自己的读写操作,而且也监听(snoop)其他Cache的读写操作。每个Cache line所处的状态根据本核和其他核的读写操作在4个状态间进行迁移,迁移图如下:这边是网络盗图过来的,书中的黑白色看起来难受,

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型

有几点说明:

1. Local Read表示本内核读本Cache中的值。

2. Local Write表示本内核写本Cache中的值。

3. Remote Read表示其他内核读其他Cache中的值。

4. Remote Write 表示其他内核写其他Cache中的值。

5. 箭头表示本Cache line状态的迁移,环形箭头表示状态不变。

注意点在于 当内核需要访问的数据不再本Cache中,而其他Cache有这份数据的备份时,本Cache既可以从内存中农导入数据,也可以从其他Cache中导入数据,不同的处理器会有不同的选择。MESI协议没有定义这些细节,只规定了状态之间的迁移。

;;;;;;;下面的描述假设本Cache从内存中导入数据;;;;;;;;;;

读 - 深入理解java虚拟机 - 笔记(二) - java内存模型与线程(12章)-处理器的内存模型