malloc 底层实现与两个系统调用

时间:2024-03-31 22:34:49

https://www.cnblogs.com/zpcoding/p/10808969.html

https://blog.csdn.net/jojozym/article/details/104907182
以上这篇我的博文解释了malloc与new的区别

https://www.cnblogs.com/zpcoding/p/10808969.html

本篇讲讲malloc底层是如何实现的。

在32位系统里,进程地址空间分为以下几块:代码段(.text)、数据段(.data)、堆、栈、内核空间(3G-4G)。
其中堆和栈中间空着一块区域,在使用malloc和free时,就是在这片空间上进行操作
malloc 底层实现与两个系统调用
malloc可能使用两种系统调用,当malloc(size)里的size小于128k(可由M_MMAP_THRESHOLD选项调节)时,使用brk调用,size大于128k时,使用mmap调用

缺页中断

当一个进程发生缺页中断的时候,进程会陷入核心态,执行以下操作:

1)检查要访问的虚拟地址是否合法

2)查找/分配一个物理页

3)填充物理页内容(读取磁盘,或者直接置0,或者什么都不做)

4)建立映射关系(虚拟地址到物理地址的映射关系)

5)重复执行发生缺页中断的那条指令

可以看到,在未读写数据时,是不分配物理内存的!懒惰就是力量!

1、size小于128k,使用brk

malloc 底层实现与两个系统调用
我们通过控制堆顶指针(_edata)实现brk调用的虚拟内存分配。但不对应物理内存(因此没有初始化),第一次读/写数据时,引起内核缺页中断,内核才分配对应的物理内存,然后虚拟地址空间建立映射关系

brk引起的碎片问题

brk实际上只是用一个指针,标志了可能分配了虚拟内存的高位地址(在_edata以下可能有分配虚拟内存)。brk分配的内存需要等到高地址内存释放以后才能释放(例如,在B释放之前,A是不可能释放的,因为只有一个_edata 指针,这就是内存碎片产生的原因)
显而易见的一个问题就是,一个指针没办法标志其中的空闲内存、已分配内存。如果我们连续只分配而不释放,很快就会产生小内存碎片。mmap分配的内存可以单独释放。

那么问题来了,什么时候释放?
当最高地址空间的空闲内存超过128K(可由M_TRIM_THRESHOLD选项调节)时,执行内存紧缩操作(trim)。在上一个步骤free的时候,发现最高地址空闲内存超过128K,于是内存紧缩。详细例子见后文,先来讲讲mmap。

2、size大于128k,使用mmap

malloc 底层实现与两个系统调用
图4是调用malloc(200K)的结果,底层使用mmap分配了空间C,图5是调用malloc(100K)的结果,底层使用brk分配了空间D,free(C)可以轻松释放虚拟内存和物理内存mmap分配的内存真的很好释放!
B是brk调用分配的内存空间,free(B)会发生什么呢?
malloc 底层实现与两个系统调用
free(B)不会改变_edata的位置,也不会释放物理内存和虚拟内存,在此基础上调用free(D)却可以完成我们想完成的事情!这是因为free内部执行了内存紧缩操作(trim)!这里的内存紧缩仅发生在堆顶端的空闲空间大于128K时(可由M_TRIM_THRESHOLD选项调节)。

后续再写写看mmap与shm的辨析,感谢观看!