armv8 memory translation

时间:2024-03-26 16:34:26

AArch32,arm的32bit架构;

AArch64,arm的64bit架构;

ARMv8.2-LPA,是armv8.2中的新feature,扩大了IPA和PA的支持范围,从48bit扩展到52bit。

armv8-a core内部使用virtual memory,内部通过mmu转换为physical address。

mmu的好处:

  1)允许system同时运行多个task,各个task之间完全是地址透明的。

  2)同一个task,code在编写的时候,也完全不需要了解processor内部的地址分配。

  3)mmu还可以实现memory access permission的控制,memory attribute的控制,cache policy的控制

这样app的编写,编译,链接都是在virtual memory space中进行的。

arm提出trustzone之后,定义了两种physical address space,在理论上,secure和non-secure的physical address

  应该是完全分开的两个地址空间,甚至存储器,但是在实现中,多通过bus attribute来进行控制。表示的是

  同一块地址,在进行secure和non-secure切换的时候,需要自己保存上下文

arm规定,non-secure不能访问secure空间,但是secure是可以访问secure和non-secure的,这样的化,在应用中

  如果一个secure的master,读了两次同一个地址,一次是secure bus读,一次是non-secure bus读,这样在cache

  中会出错,所以一般要求,secure在读取non-secure的时候,要求使用non-secure bus attr

mmu内部的translation table根据exception level分为四级:

  1) EL0------app

  2) EL1------kernel

  3) EL2------hypervisor,armv7加入的一个arm core mode,主要为了virtualization。

  4) EL3------secure monitor,在trustzone切换过程中的mode。

一般情况下EL0是执行在unprivilege mode下的,其他三种都是执行在privilege mode下的。需要配置自己的TCR寄存器

EL0和EL1都可以执行在non-secure或secure mode下,但是EL2只能执行在non-secure mode下,EL3只能执行在secure mode下

EL0和EL1的translation table base address是指定在寄存器中,Translation Table Base Registers(TTBR0_EL1)和(TTBR1_EL1)

  EL0和EL1的区分是通过VA的高位地址来区分的,OS的地址都在高位,高位都为1;

                        APP的地址都在低位,高位都为0;

  一般是16bit的高位,这样和32bit级联起来,刚好48bits

EL2和EL3都只有TTBR0,寄存器分别为TTBR0_EL2和(TTBR0_EL3)

除了base address,还有一个Translation control register(TCR_EL1),其中控制

  1)IPA size,最终的PA的范围大小,3bits,000---32bitsPA,101---48bitsPA

  2)TG0/TG1,translation table的size大小,2bits,00---4KB,01---16KB,11---64KB  (Translation Granule)

  3)T0SZ/T1SZ,高bits的位数,来区分EL0/EL1的高位,5bits

VA到PA的translation:

  对于一个nbits的VA空间的应用,高位64-n必须是全零或者全1,否则mmu会报event error。

  VA的低位地址,或直接作为PA中的offset,具体bit是按design而定的。

一个转换的流程图,多级转换:

  armv8 memory translation

TTBR0_EL1,TTBR1_EL1以及TCR_EL1都是不区分secure和non-secure的寄存器,所以在secure切换的时候,

  必须自己做context的保存。

VMSAv8-64的translation table format descripter:

  主要有以下几个方面,

  1) invalid或者valid; bit[0]

  2) table entry或者block entry;  bit[1]

descripter与granule的颗粒有关系,

      4k granule      16granule        64granule

  level0  block entry不支持  block entry不支持    block entry不支持

  level1            block entry不支持    block entry不支持(主要看ARMv8.2-LPA是否支持)

  level2             

对于level3的table,都是支持block entry的,不支持table entry         

对于不支持ARMv8.2-LPA的level0-level3的descripter的各种格式,

    armv8 memory translation

level3的descripter格式:

    armv8 memory translation

amrv8.2中的多级地址映射:

  两级的translations,主要引入了hypervisor的控制,stage1由guest os控制,stage2由hypervisor控制。

    armv8 memory translation

  1) 主要在level0和level1进行了扩展,可能会有stage2。对于secure的操作,系统中是不允许在做stage2的

    对于non-secure操作,需要配置Hypervisor Configuration Register(HCR_EL2)来进行stage2。

  2) EL2和EL3都是只有stage1的,Translation base table,分别有自己的TTBR0_EL2/EL3,secure world是不允许有virtualization的

  3) stage2的 Translation base table寄存器是单独的VTTBR0_EL2,并且有自己单独的control寄存器VTCR_EL2

另一类的access的控制,是对执行attr的控制,反应到bus上就是某些instruction的prefetch不能再一些地址上进行。

  block/page可以被标识为Execute Never(XN),Unprivilege Execute Never(UXN),Privilege Execute Never(PXN),

  通过配置每个level的SCTLR_ELn寄存器来实现。

AF(access flag),是软件的应用,表明目前该page是否被访问过,优化在OS memory control中的实现。

Bit[58:55],不论是block descripter还是table descripter,中都会预留,为OS使用。可以存放page是否dirty等信息。

mmu中还包括secure ctrl register(SCR)寄存器,可以定义secure是否可以访问non-secure的空间,

arm中还定义了指令LDTR和STTR,可以允许在EL1中执行数据的加载和写入,权限等是按照EL0的配置来执行

  在其他的except level中,LDTR和STTR指令与普通的LDR和STR相同。

TLB(Translation Lookaside Buffer),MMU中访问page translation的cache,每个TLB的entry,都包括memory type,

  cache policy,access permission,ASID,VMID等信息。

如果memory中的translation entry已经更新,但是TLB中的未更新,这时需要OS进行invalidation stale TLB entry

  指令TLBI <type> <level>,可以指定stage-level,specify-attr等。

      ALL,VMALL,VMALLSI2,ASID,VA,VAA

  TLB中的entry是区分secure和non-secure的,所以在secure切换的时候,是不需要context-switch的。