arm-linux启动过程(1)

时间:2022-03-23 15:53:11


arm-linux启动过程

 

1. kernel运行的史前时期和内存布局

 

在arm平台下,zImage.bin压缩镜像是由bootloader加载到物理内存,然后跳到zImage.bin里一段程序,它专门于将被压缩的kernel解压缩到KERNEL_RAM_PADDR开始的一段内存中,接着跳进真正的kernel去执行。该kernel的执行起点是stext函数,定义于arch/arm/kernel/head.S。

 

在分析stext函数前,先介绍此时内存的布局如下图所示

 

arm-linux启动过程(1)

 

在开发板tqs3c2440中,SDRAM连接到内存控制器的Bank6中,它的开始内存地址是0x30000000,大小为64M,即0x20000000。 ARM Linux kernel将SDRAM的开始地址定义为PHYS_OFFSET。经bootloader加载kernel并由自解压部分代码运行后,最终kernel被放置到KERNEL_RAM_PADDR(=PHYS_OFFSET + TEXT_OFFSET,即0x30008000)地址上的一段内存,经此放置后,kernel代码以后均不会被移动。

 

在进入kernel代码前,即bootloader和自解压缩阶段,ARM未开启MMU功能。因此kernel启动代码一个重要功能是设置好相应的页表,并开启MMU功能。为了支持MMU功能,kernel镜像中的所有符号,包括代码段和数据段的符号,在链接时都生成了它在开启MMU时,所在物理内存地址映射到的虚拟内存地址。

 

以arm kernel第一个符号(函数)stext为例,在编译链接,它生成的虚拟地址是0xc0008000,而放置它的物理地址为0x30008000(还记得这是PHYS_OFFSET+TEXT_OFFSET吗?)。实际上这个变换可以利用简单的公式进行表示:va = pa – PHYS_OFFSET + PAGE_OFFSET。Arm linux最终的kernel空间的页表,就是按照这个关系来建立。

 

之所以较早提及arm linux 的内存映射,原因是在进入kernel代码,里面所有符号地址值为清一色的0xCXXXXXXX地址,而此时ARM未开启MMU功能,故在执行stext函数第一条执行时,它的PC值就是stext所在的内存地址(即物理地址,0x30008000)。因此,下面有些代码,需要使用地址无关技术。

 

2.一览stext函数

 

stext函数定义在Arch/arm/kernel/head.S,它的功能是获取处理器类型和机器类型信息,并创建临时的页表,然后开启MMU功能,并跳进第一个C语言函数start_kernel。

 

stext函数的在前置条件是:MMU, D-cache, 关闭; r0 = 0, r1 = machine nr, r2 = atags prointer.

 

代码如下:

 

  1.   .section ".text.head""ax"  
  2.   
  3. (stext)  
  4.   
  5.    
  6.   
  7.   msr  cpsr_c, #PSR_F_BIT PSR_I_BIT SVC_MODE ensure svc mode  
  8.   
  9.                                      and irqs disabled  
  10.   
  11.   mrc p15, 0, r9, c0, c0        get processor id  
  12.   
  13.   bl    __lookup_processor_type         r5=procinfo r9=cupid  
  14.   
  15.   
  16.   
  17.    movs  r10, r5                         invalid processor (r5=0)?  
  18.   
  19.   beq __error_p                    yes, error 'p'  
  20.   
  21.   bl    __lookup_machine_type            r5=machinfo  
  22.   
  23.   
  24.   
  25.    movs  r8, r5                           invalid machine (r5=0)?  
  26.   
  27.   beq __error_a                    yes, error 'a'  
  28.   
  29.   
  30.   
  31.   bl    __vet_atags  
  32.   
  33.   
  34.   
  35.   bl    __create_page_tables  
  36.   
  37.   
  38.   
  39.     
  40.   
  41.    
  42.   
  43.   ldr   r13, __switch_data             address to jump to after  
  44.   
  45.                                      mmu has been enabled  
  46.   
  47.   adr  lr, __enable_mmu        return (PIC) address  
  48.   
  49.   add pc, r10, #PROCINFO_INITFUNC  
  50.   
  51. OC(stext)  


 

3 __lookup_processor_type 函数

 __lookup_processor_type 函数是一个非常讲究技巧的函数,如果你将它领会,也将领会kernel了一些魔法。

Kernel代码将所有CPU信息的定义都放到.proc.info.init段中,因此可以认为.proc.info.init段就是一个数组,每个元素都定义了一个或一种CPU的信息。目前__lookup_processor_type使用该元素的前两个字段cpuid和mask来匹配当前CPUID,如果满足CPUID & mask == cpuid,则找到当前cpu的定义并返回。 

下面是tqs3c2440开发板,CPU的定义信息,cpuid = 0x41009200,mask = 0xff00fff0。如果是码是运行在tqs3c2440开发板上,那么函数返回下面的定义:

 

  1.        .section ".proc.info.init"#alloc, #execinstr  
  2.   
  3.    
  4.   
  5.        .type       __arm920_proc_info,#object  
  6.   
  7. __arm920_proc_info:  
  8.   
  9.        .long       0x41009200  
  10.   
  11.        .long       0xff00fff0  
  12.   
  13.        .long   PMD_TYPE_SECT  
  14.   
  15.               PMD_SECT_BUFFERABLE  
  16.   
  17.               PMD_SECT_CACHEABLE  
  18.   
  19.               PMD_BIT4  
  20.   
  21.               PMD_SECT_AP_WRITE  
  22.   
  23.               PMD_SECT_AP_READ  
  24.   
  25.        .long   PMD_TYPE_SECT  
  26.   
  27.               PMD_BIT4  
  28.   
  29.               PMD_SECT_AP_WRITE  
  30.   
  31.               PMD_SECT_AP_READ  
  32.   
  33.         
  34.   
  35.            __arm920_setup  
  36.   
  37.        .long       cpu_arch_name  
  38.   
  39.        .long       cpu_elf_name  
  40.   
  41.        .long       HWCAP_SWP HWCAP_HALF HWCAP_THUMB  
  42.   
  43.        .long       cpu_arm920_name  
  44.   
  45.        .long       arm920_processor_functions  
  46.   
  47.        .long       v4wbi_tlb_fns  
  48.   
  49.        .long       v4wb_user_fns  
  50.   
  51. #ifndef CONFIG_CPU_DCACHE_WRITETHROUGH  
  52.   
  53.        .long       arm920_cache_fns  
  54.   
  55. #else  
  56.   
  57.        .long       v4wt_cache_fns  
  58.   
  59. #endif  
  60.   
  61.        .size __arm920_proc_info, __arm920_proc_info  


 

  1.    
  2. __lookup_processor_type:  
  3.         
  4.   
  5.        adr  r3, 3f  
  6.   
  7.         
  8.   
  9.        ldmda     r3, {r5 r7}  
  10.   
  11.        
  12.   
  13.        sub  r3, r3, r7                     get offset between virt&phys  
  14.   
  15.        
  16.   
  17.        add r5, r5, r3                     convert virt addresses to  
  18.   
  19.        
  20.   
  21.        add r6, r6, r3                     physical address space  
  22.   
  23.        
  24.   
  25. 1:    ldmia      r5, {r3, r4}                  value, mask  
  26.   
  27.        
  28.   
  29.        and  r4, r4, r9                     mask wanted bits  
  30.   
  31.        teq  r3, r4  
  32.   
  33.        beq 2f  
  34.   
  35.        
  36.   
  37.        add r5, r5, #PROC_INFO_SZ        sizeof(proc_info_list)  
  38.   
  39.        
  40.   
  41.        cmp r5, r6  
  42.   
  43.        blo  1b  
  44.   
  45.        
  46.   
  47.        mov r5, #0                          unknown processor  
  48.   
  49. 2:    mov pc, lr  
  50.   
  51. ENDPROC(__lookup_processor_type)  
  52.   
  53.        .long       __proc_info_begin  
  54.        .long       __proc_info_end  
  55. 3:    .long        
  56.        .long       __arch_info_begin  
  57.        .long       __arch_info_end  
 

4 __lookup_machine_type 函数

__lookup_machine_type 和__lookup_processor_type像对孪生兄弟,它们的行为都是很类似的:__lookup_machine_type根据r1寄存器的机器编号到.arch.info.init段的数组中依次查找机器编号与r1相同的记录。它使了与它孪生兄弟同样的手法进行虚拟地址到物理地址的转换计算。

 

在介绍函数,我们先分析tqs3c2440开发板的机器信息的定义:

  1. Arch/arm/include/asm/mach/arch.h   
  2.   
  3. #define MACHINE_START(_type,_name)                  \  
  4.   
  5. static const struct machine_desc __mach_desc_##_type       
  6.   
  7.  __used                                            
  8.   
  9.  __attribute__((__section__(".arch.info.init")))  
  10.   
  11.        .nr          MACH_TYPE_##_type,               
  12.   
  13.        .name            _name,  
  14.   
  15.    
  16.   
  17. #define MACHINE_END                       \  
  18.   
  19. };  


 

MACHINE_START宏用于定义一个.arch.info.init段的数组元素。.nr元素就是函数要比较的变量。Tqs3c2440开发板相应的定义如下:

 

  1. MACHINE_START(S3C2440, "TQ2440" 
  2.   
  3.        .phys_io S3C2410_PA_UART,  
  4.   
  5.        .io_pg_offst   (((u32)S3C24XX_VA_UART) >> 18) 0xfffc,  
  6.   
  7.        .boot_params       S3C2410_SDRAM_PA 0x100,  
  8.   
  9.    
  10.   
  11.        .init_irq   s3c24xx_init_irq,  
  12.   
  13.        .map_io         tq2440_map_io,  
  14.   
  15.        .init_machine  tq2440_machine_init,  
  16.   
  17.        .timer             &s3c24xx_timer,  
  18.   
  19. MACHINE_END  


 

这是一个struct machine_desc结构,在后面的C代码(start_kernel开始执行的代码)会使用该变量对象。在tqs3c2440开发中的__lookup_machine_type函数就是返回该对象指针。

这里涉及很多函数指针,它们都是在start_kernel函数里在各种阶段进行初始化的回函数。如map_io指向的tq2440_map_io就是在建立好内核页表后,再调用它来针对开发板的各种IO端口来建立相关的映射和页表。

至于__loopup_machine_type的代码就不作详细分析,请对比__lookup_processor_type来自行分析。代码如下:

 

  1.   
  2.   
  3. __lookup_machine_type:  
  4.   
  5.        adr  r3, 3b  
  6.   
  7.        ldmia      r3, {r4, r5, r6}  
  8.   
  9.        sub  r3, r3, r4                     get offset between virt&phys  
  10.   
  11.        add r5, r5, r3                     convert virt addresses to  
  12.   
  13.        add r6, r6, r3                     physical address space  
  14.   
  15. 1:    ldr   r3, [r5, #MACHINFO_TYPE] get machine type  
  16.   
  17.        teq  r3, r1                           matches loader number?  
  18.   
  19.        beq 2f                         found  
  20.   
  21.        add r5, r5, #SIZEOF_MACHINE_DESC     next machine_desc  
  22.   
  23.        cmp r5, r6  
  24.   
  25.        blo  1b  
  26.   
  27.        mov r5, #0                          unknown machine  
  28.   
  29. 2:    mov pc, lr  
  30.   
  31. ENDPROC(__lookup_machine_type)