Linux 内核开发 - 进程空间

时间:2023-12-24 13:11:13

1.1 虚拟内存

Linux 的系统。假设每一个任务都独立的占用内存,则实际的物理内存将非常快消耗殆尽。实际上对于前台正在执行的任务来说,所须要要的内存并不多,非常多任务基本不须要执行,也就没有必要一直占用内存,虚拟内存技术採用硬盘来充当一部分内存,当内存不足时就将不须要在内存中使用的数据搬移到硬盘中去,当任务须要执行时又将硬盘中的数据搬回物理内存。

虚拟内存技术不仅起到了保护操作系统的作用,并且使得用户程序能够使用到比实际物理内存更大的地址空间,屏蔽了实际物理内存对用户地址空间的影响。

1.2 地址空间的划分

对于一个进程而言,Linux 系统将虚拟地址空间划分为用户空间与内核空间,用户空间占用3G(0x0~0xBFFFFFFF),而内核空间占用1G(0xC0000000 ~ 0xFFFFFFFF)。

Linux 是一个多用户的系统,每一个用户就是一个进程,享有独立的地址空间,可是它们是共享内核空间。不同的进程之间进行切换的时候,内核空间的是不变的。

1.3 用户空间

Linux 应用程序时在用户空间执行,仅仅有当产生中断或者当出现系统调用的时候进程才会从用户态切换到内核态。

完毕中断操作或者系统调用后又回到用户态。

1.4 内核空间

Linux 的核心程序执行在内核空间,这是为了保护核心程序不受劣质应用程序的影响而崩溃,并且能起到保护数据的作用。

由于应用程序不具有直接控制硬件的权限,仅仅有内核程序才干拥有系统的最高权限。

1.5 内核内存的分配与释放

在创建进程fork()、动态非配内存malloc()时分配的内存都仅仅是虚拟内存。而不是物理内存,之后在实际訪问分配的虚拟地址时,才会由“请页机制”产生“缺页”异常。进入实际分配页框的程序。

“缺页”异常是是虚拟内存赖以生存的基础。他会告诉内核为进程分配物理页。并建立页表。这时虚拟地址才映射到实际的物理地址。

在应用程序中,使用的是malloc来动态分配内存,而在内核中使用的是kmalloc来分配内存,kmalloc的原型是

#include<linux/slab.h>

#include<linux/gfp.h>

void *kmalloc(size_t size , int flags);

參数:

size:须要分配内存的大小

flags:分配标志。控制kmalloc的行为

下面是flages 可能的标志。

最经常使用的GFP_KERNEL,他表示内存分配(终于总是调用get_free_pages来实现实际的分配,这就是,这就是GFP前缀的由来)是代表执行在内核空间的进程执行的。

使用GFP_KERNEL容许kmalloc在分配空暇内存时候假设内存不足容许把当前进程睡眠以等待。因此这时分配函数必须是可重入的。

假设在进程上下文之外如:中断处理程序、tasklet以及内核定时器中这样的情况下current进程不该睡眠。驱动程序该使用GFP_ATOMIC。

  • lGFP_ATOMIC

用来从中断处理和进程上下文之外的其它代码中分配内存. 从不睡眠.

  • GFP_KERNEL

内核内存的正常分配. 可能睡眠.

  • GFP_USER

用来为用户空间页来分配内存; 它可能睡眠.

  • GFP_HIGHUSER

如同 GFP_USER, 可是从高端内存分配, 假设有. 高端内存在下一个子节描写叙述.

  • GFP_NOIO

类似 GFP_KERNEL。但禁止不论什么 I/O 初始化

  • GFP_NOFS

类似 GFP_KERNEL,但不同意运行不论什么文件系统调用

  • __GFP_DMA

这个标志要求分配在可以 DMA 的内存区. 确切的含义是平台依赖的而且在以下章节来解释.

  • __GFP_HIGHMEM

这个标志指示分配的内存能够位于高端内存.

  • __GFP_HIGH

这个标志标识了一个高优先级请求, 它被同意来消耗甚至被内核保留给紧急状况的最后的内存页.

  • __GFP_REPEAT

当它有困难满足一个分配. __GFP_REPEAT 意思是" 更尽力些尝试" 通过反复尝试 -- 可是分配可能仍然失败

  • __GFP_NOFAIL

告诉分配器不要失败; 它尽最大努力来满足要求. 使用 __GFP_NOFAIL 是强烈不推荐的

  • __GFP_NORETRY

告知分配器马上放弃假设得不到请求的内存.

1.6 按页分配与释放

假设内核模块须要分配大块内存,使用面向页的分配技术会更好。

#include<linux/gfp.h>

  • get_zeroed_page(unsigned int flags)

返回新页面的指针,并将页面清零。

  • __get_free_page(unsigned int flags);

申请一个页面,返回新页面的指针,但不清零页面。

  • __get_free_pages(unsigned int flags ,unsigned int order)

分配并返回一个纸箱内存区第一个字节的指针,内存区可能是一个或者多个页长,可是没有清零(物理上连续)。

order 是你在请求的或释放的页数的以 2 为底的对数(即, log2N). 比如, 假设你要一个页 order 为 0, 假设你请求 8 页就是 3. 假设 order 太大(没有那个大小的连续区可用), 页分配失败. get_order 函数, 它使用一个整数參数, 能够用来从一个 size 中提取 order(它必须是 2 的幂)给主机平台. order 同意的最大值是 10 或者 11 (相应于 1024 或者 2048 页), 依赖于体系. 可是, 一个 order-10 的分配在除了一个刚刚启动的有非常多内存的系统中成功的机会是小的。

  • void free_pages(unsigned long addr , unsigned long order);

释放释放的页内存。

  • void free_page(unsigned long addr);

释放释放的页内存。须要注意的是假设释放的系统内存与分配的内存不一致会导致系统错误。

Linux 内核开发 - 进程空间

1.7 内核空间的内存分布

内核空间是有内核进行映射的,它不会跟着进程变化,是固定的。

Linux 内核开发 - 进程空间

什么是高端内存:

在x86结构中。内核被分为三个区块。区域分布例如以下(Linux 与x86类似):

ZONE_DMA        内存開始的16MB

ZONE_NORMAL       16MB~896MB

ZONE_HIGHMEM       896MB ~ 结束

896M以上被称为高端内存,896M下面被称为低端内存。

  • 直接映射区(Direct Memory Region)

从0xC0000000(3G)開始的最多896的内存区域被称作直接映射区,这是由于该区域的线性地址和物理存在直接的线性转换关系:

线性地址 = 0xc0000000 + 物理地址

比方物理地址为0x100000 ~ 0x200000 的线性地址就是0xc0100000 ~ 0xc0200000

直接映射区的内存能够通过kmalloc直接分配。

  • 动态映射区()

该区域的地址通过vmalloc来进行分配。须要注意的是vmalloc所分配出内存区的线性地址连续,可是物理内存区域是不一定是连续的。它是通过页表的方式将各个空暇的页连接起来使用,所以效率要比kmalloc 要低非常多。

只是vmalloc所分配出来的地址可能出于高端内存、也可能出于低端内存。

  • 永久内存映射区(PKMap Region)

该区域可訪问高端内存。訪问方法是使用alloc_page(_GFP_HIGHMEM)分配高端内存页或者使用kmap函数将分配到的高端内存映射到该区域。

永久映射区经常使用的全局变量:

PKMAP_BASE:永久映射空间的起始地址。

永久映射空间为4M。所以它最多能映射4M/4K=1024个页面。

pkmap_page_table:永久映射空间相应的页文件夹。我们来看一下它的初始化:

pkmap_page_table = pte_offset_kernel(pmd_offset(pgd_offset_k

(PKMAP_BASE), PKMAP_BASE), PKMAP_BASE);

实际上它就是PKMAP_BASE所在的PTE

LAST_PKMAP:永久映射空间所能映射的页面数。在没有开启PAE的情况下被定义为1024

highmem_start_page:高端内存的起始页面

pkmap_count[PKMAP]:每一项用来相应映射区域的引用计数

  • 固定映射区(Fixing Mapping Region)

该区域和4G的顶端仅仅有4k的隔离带。其每一个地址项都服务于特定的用途。如ACPI_BASE等。

Linux 内核开发 - 进程空间

版权声明:本文博主原创文章,博客,未经同意不得转载。