3.1 80x86汇编与C语言-1

3.1.1 80x86汇编与C语言-1 - 汇编程序员眼中的系统结构

汇编程序员眼中的系统结构

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

如何从C代码生成汇编代码

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

gcc -O2 -S code.c -m32 -fno-omit-frame-pointer

-O2 表示有一定的优化的 level ；
-S 表示要从 code.c 原始 c 程序，把它编译成一个.s汇编程序；
-m32 表示要生成32位代码。

汇编语言数据格式

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.1.2 80x86汇编与C语言-1 - 第一条汇编指令

第一条汇编指令实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

l 表示两个整数相加。

这条add指令操作数有两个实际上就是x加y等于t因为是两个操作数那么我们肯定知道就是说肯定是8ebp eax相加加起来之后的和放到eax里面去也就是说这个指令的操作数是两个目的寄存器是在右侧那个当然它既是目的又是源实际上两个都是源加完之后放到目的寄存器目的寄存器就是右侧的第二个源加起来就完了

数据传送指令（mov）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

(
立即数，实际上就是常整数。
)

数据传送指令支持的不同操作数类型组合

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

括号里面是什么呢表示内存地址。(应该是指大括弧。)

简单的寻址模式

如果我们有个操作数是访问内存的话，那么内存地址怎么计算或者叫做怎么寻址？

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

间接寻址

movl (%ecx),%eax中，(%ecx)就是把寄存器ecx里面的数值作为一个Memory的address，去访问Memory Address里面的数据，把这个数据拿出来，而不是Address拿出来，是把Memory Address所指明的那个位置里面的数据拿出来，把它作为操作数mov过去。这就叫做间接寻址。

基址加偏移量的寻址

还有个叫做基址加偏移量的寻址实际上跟那个差不多无非就是说我在括号外面加了一个常数比方说这里面就是8 8括号百分号ebp 寄存器ebp里面的值拿出来加上8 加出来的和作为内存的地址有了内存地址之后呢把内存中的这个数取出来取出来之后再挪过去这个叫做基址加偏移量寻址

所以注意这种表示方式括号里面百分号ecx 那么这样子的表示方式ecx value表示Address 如果外面再有一个常数注意常数前面是没有dollar号如果加上dollar号就是什么了就表示它是一个常量不是地址不要加这个把两个数加起来之后变成内存地址这就取出来取出来的这个数就作为操作数之一挪过去

3.1.3 80x86汇编与C语言-1 - 寻址模式

寻址模式使用实例

swap.c：

void swap(int *xp, int *yp)
{
        int t0 = *xp;
        int t1 = *yp;
        *xp = t1;
        *yp = t0;
}

汇编得到的swap.s：

$ gcc -O2 -S swap.c -m32 -fno-omit-frame-pointer
$ cat swap.s
        .file   "swap.c"
        .section        .text.unlikely,"ax",@progbits
.LCOLDB0:
        .text
.LHOTB0:
        .p2align 4,,15
        .globl  swap
        .type   swap, @function
swap:
.LFB0:
        .cfi_startproc
        pushl   %ebp
        .cfi_def_cfa_offset 8
        .cfi_offset 5, -8
        movl    %esp, %ebp
        .cfi_def_cfa_register 5
        pushl   %ebx
        .cfi_offset 3, -12
        movl    8(%ebp), %edx
        movl    12(%ebp), %eax
        movl    (%edx), %ecx
        movl    (%eax), %ebx
        movl    %ebx, (%edx)
        movl    %ecx, (%eax)
        popl    %ebx
        .cfi_restore 3
        popl    %ebp
        .cfi_restore 5
        .cfi_def_cfa 4, 4
        ret
        .cfi_endproc
.LFE0:
        .size   swap, .-swap
        .section        .text.unlikely
.LCOLDE0:
        .text
.LHOTE0:
        .ident  "GCC: (Ubuntu 5.4.0-6ubuntu1~16.04.9) 5.4.0 20160609"
        .section        .note.GNU-stack,"",@progbits

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

实例分析

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

后续详细请看视频，我也没有听懂这里。

3.1.4 80x86汇编与C语言-1 - 地址计算指令与其它 - 1

变址寻址

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

寻址模式实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

地址计算指令

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

地址计算指令leal l表示后缀就是我算的目的操作数是double word类型那它实际上跟mov非常像也是两个操作数 src和Destination 注意 src是地址计算表达式什么叫做地址计算表达式就像我们刚才说过了实际上就是变址寻址一共四个要素基址加上index乘上scale 再加上displacement 就是说src就是这种表达方式只要是这种的合法表达方式它就可以作为src

Destination一般来说就是个寄存器就是说我把src的地址表达式值给算出来算出来的地址赋给Destination

注意它跟mov很像但是有本质上的不同 mov如果你的src是地址表达式的话它会去访存它把地址算出来之后真真正正的去访存访问Memory 把Memory中的数据取出来再mov过去

leal很简单我要算出的地址就是我所需要的数据你把这个地址表达式写清楚算完了算完了之后这个地址本身我是作为操作对象挪到Destination里面去的这是一个很大的区别因为它是完成地址计算

所以说它的用途呢一大用途就是地址计算但不访存比方说在C里面我定义了数组x 一个什么什么的数组我要计算它的地址 D等于一个取地址的运算x方括号i 这个很常见屏幕上打出来的这个很常见的这种情况实际上就是用leal指令计算就完了我还是把它的基址加上index 乘上sizeof就完了对吧这个算出来就是我所需要的地址这个地址就是我的目标我的目的把这个目的就是把我要算出的地址值赋过去赋给p就ok了所以它可以用于地址计算无需访存

另外一个是比较巧妙的地址计算表达式里面有4个要素基址 index scale 再加上D这个常量那么这种情况下呢它可以完成x加上k乘以y 这一类型的整数计算这里面的x和y可以是寄存器也就说是可变的 k是个常量就是说如果你能把一个整数计算表达成一个这样的形式的话那么就很方便的可以利用leal来计算这个比你用单独的加减或者乘指令分开去运算效率要高要快所以说我们可以发现编译器大量的使用leal指令除了完成地址计算之外大量的使用leal指令完成整数数值的计算

整数计算指令

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

算术右移跟逻辑右移不一样的地方在于因为你的数据整个往右侧挪动了高位得把别的数据补进来补什么呢逻辑右移就单纯的补0 算数右移就补被移动数据的最高位符号位补符号位这是个区别

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.1.5 80x86汇编与C语言-1 - 地址计算指令与其它 - 2

将leal指令用于计算（实例1）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

实例2

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

sarl中，a代表arith算术，r代表right右移。 l 表示它是一个 double word 的运算

3.1.6 80x86汇编与C语言-1 - x86-64下的通寄存器与汇编指令—-初步

x86-32与x86-64的数据类型宽度

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64的通用寄存器

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

rsp 还是保留工作站点寄存器。

x86-32下的swap

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64下的…

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64下long int类型的swap

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

小结

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86汇编的格式

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

练习题

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.2 80x86汇编与C语言-2

3.2.1 80x86汇编与C语言-2 - 条件码

Control Flow（控制流）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

汇编程序员眼中的体系结构（部分）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

条件码

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

首先咱们解释一下什么是条件码条件码共分成四位你可以理解为呢是四个一位的寄存器呗每个里面呢就存储了这些标志位

第一个呢就是CF位叫进位位第二个呢叫符号位第三个呢叫0 也就是说你的计算结果是不是0由它来标识第四个呢就是溢出位

这个进位大家我们想想看可用于检测无符号整数运算的溢出回想一下如果是两个无符号整数相加的话如果最高位向上产生了进位那么就预示着这时候就无符号整数运算就发生了溢出啦

那么如果这个相加这个数出来是个负的就是最高位是个1 当然这种情况下我们就把它作为带符号处理啦那么这个时候呢这SF呢就设成1 否则就设成0 也就是说根据不同的结果来设置

我记得以前呢在课堂上跟大家讲过就是一个整数你是带还是不带符号也好在机器层面它的表示是一样的都是一个0101的一个串 01串那么在机器看起来你光从这个存储格式上面是看不出这个数是带还是不带符号的而且我们也讲过啦因为补码的特性你对它进行简单的加减运算比如说加减指令在机器层面来说补码运算的加减和原码运算的加减实际上是一套电路实际上就一条指令一类指令来实现所以针对add而言呢它做加法的话实际上它是不区分你是带符号还是不带符号的整型

但是它们的区别就在这个地方就是说 add指令它做完之后或者说在它做的同时它会判断两个进位标志就是CF位和OF位就是说如果一方面就是把它作为无符号整数的话那么如果它溢出了就会把CF置位如果把这两个数作为带符号整数处理的话那么如果它溢出了就会把OF置位也就是说硬件上面还是考虑的比较多的

我们以前问过大家一个问题就是既然在硬件层面如果表示上在指令上对带符号数和不带符号数如果都没有区分的话那么谁来区分这个事儿呢当然编译器来区分编译器会知道你这个数是带符号还是不带符号但编译器到底怎么区分呢它也得依赖于硬件的某些指令或者某些条件码嘛所以它就依赖于这两个条件码分别进行判断如果编译器认为你这两个数是无符号计算它有溢出了那它就通过CF位来判断那否则呢就通过OF位来判断

3.2.2 80x86汇编与C语言-2 - 比较指令与测试指令

条件码

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.2.3 80x86汇编与C语言-2 - 读取条件码指令-1

读取条件码

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.2.4 80x86汇编与C语言-2 - 读取条件码指令-2

条件码

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

那么读取条件码呢给大家还是一个典型的比较简单的C语言的一个函数咱么就看通过Gcc 把这个C函数怎么转换成什么样的一个汇编在我们直观上就有个认识就在C层面如果要读取进行比大比小两个数比大比小实际上把这个数返回的话呢

在汇编层面是怎么实现的那么再说一遍 SetX指令就是读取当前的条件码或者条件码的一些组合存入目的的字节寄存器它只存入一个byte 余下的三个字节呢不会被修改那么这个时候呢你把一个寄存器它的可能最低的那个字节给改掉了

那么余下的那个高的三个字节怎么办呢所以一般情况下我们会采用movezbl指令对目的寄存器啊进行高位的0扩展就是顾名思义我们以前课也讲过就是最后就move 这时候叫move指令 z的话呢就是说0扩展因为是b到l嘛一个byte到一个doubleword 所以就把8位扩展到32位码那怎么扩展呢就是z 叫zero 就0扩展

3.2.5 80x86汇编与C语言-2 - x86-64下的读取条件码指令

x86-64下读取条件码

读取条件码

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

我们后来翻了一下手册是这么个原因应该看得清楚什么意思呢

就是说在64位的这个体系架构下面 X86 64体系结构下面如果进行了一个32位的操作那32位的操作呢产生了一个32位的result 那么就会自动的0扩展扩展到高32位也就是说在64位的架构下面这第一条指令 eax自个儿对自个儿做了个异或做完之后它当然结果是0啦这个结果0会自动的扩展到它这个 rax的高32位

那这个看上去呢好像有一点点奇怪就是说至少我从指令上来看我的目的寄存器是eax 我完全是一个32比特的一个操作那么为什么你要把我的这个最高的就是rax 就相当于eax的高32位给它自动请0 给它0扩展呢

当然这个讲起来的话实际上跟处理器的流水线的相关性有关系就跟流水线的相关性有关系这么做呢实际上是为了减少就是流水线运行当中处理器啊不同就是前后不同指令之间的数据依赖的关系这咱们就不细说了

3.2.6 80x86汇编与C语言-2 - 跳转指令

跳转指令

条件码实际上大量的用于什么呢就用于条件执行就是说你前面有一系列的语句比如说你add也好 Test也好 Compare也好进行了一定的操作尤其像Compare 两个数据比大比小那比大比小之外呢就是如果数据大怎么着数据小怎么着这肯定有不同的if else之类的这个不同路径去跑所以这个时候就牵扯到怎么着牵扯到跳转指令了尤其是条件跳转所以条件码大量的实际上用在这个层面

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

jX j打头就是jump指令后面呢就是一个后缀就是说我这个jump依赖于什么条件或者说什么条件码的组合那么它这个意思就是说依赖于当前的条件码当然或者条件码的组合了选择下一条执行语句就是你是顺着跑呢还是jump到另外一个地方去叫做跳转指令那首先就是第一条jmp 那这个没得说就是我是无条件跳转就1了条件是1等于永远满足那咱们没的说了

那么剩下那个咱们一看呢当然后缀啊跟Set差不多刚才我们就是说sete啊 setne啊这边是je jne之类的那什么意思呢就是说如果相关的条件满足比如说je 条件码是ZF 这个位是1 也就是说刚才那个比较是个zero 称为结果0或者结果相等那么这种情况下呢就跳转那否则就顺序走

那jne呢就刚刚跟它反过来那js jns也是类似当然后面还有ja jb jg jl 我们说过啦有一套是用于这个带符号整数比较的还有一套呢是作为不带符号整数比较的那这两套我们要区分开这两套要区分开当然你区分一次就够了因为这个后缀跟Set是一模一样的有的是用于带符号数的处理有的是用于不带符号数的处理那么大家要区分一下

条件跳转指令实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

cmpl cmpl指令 cmpl呢是eax跟edx相比较实际上就是edx减去eax 那么再往上看 movl ebp 8到edx movl ebp 12到eax 实际上无非就是把两个参数都取进来了把x y都取进来了取进来之后呢就是就是减一减减完了之后呢就是我比较一下大小啦那反正最终就是肯定是大的减小的就如果小于等于的话呢就跑到这儿就用eax减去edx 反之呢就用edx减去eax 然后当然记得结果值呢是放到eax里面去的这个差值是放到eax里面去的那实际上整体上就这么个逻辑

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.2.7 80x86汇编与C语言-2 - 条件移动指令

C语言：条件表达式

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64下…

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

一条cmovle这样的指令那我们猜一猜它是干嘛的其实也很明显就是说你条件跳转没有了代以代之一条什么指令呢一条条件传送指令 cmov就conditional move 就条件移动那么这里condition是什么呢就看你最后那个c 它这个c就是le

le让我们想到什么啊 set那一套 jump那一套后缀都是le啊什么je啊 he之类的这个都是一样的它这个什么意思呢就是这个条件也就是le满足就将数据从src传至到dest 这个c啊跟Set后面那个后缀跟jump后面那个后缀这个c是一样的这边意思就是什么呢如果小于等于的话就edi跟esi比一比如果小于等于的话我就把edx挪到eax里面去否则就什么都不做

那么我们回过头来再看看这一条代码实际上很清楚就首先就是怎么着呢就把x减y和y减x 两个值都算出来然后呢我这边当然先默认先放一个在eax里面放一个结果了因为我们最终的返回值是通过eax的然后呢再compare一下看一看前面我这个结果有没有放对如果放得对了也就是说这个le不满足那这条指令就等于是个空指令空指令就过去了如果没放对相当于这个le就满足了就小于等于这个条件满足了那我就把edx放到eax里面去就把另外一个差值替换掉原来的我们猜测的那一个然后作为返回值给它返回那么这样做的呢一个明显的好处就是说好像我就使用一条条件移动指令来替代了一条条件跳转指令那为什么呢一会儿我们再讲

x86-32下…

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3 80x86汇编与C语言-2 (续)

3.3.1 80x86汇编与c语言-2（续） - 条件移动指令的体系结构背景-1

微体系结构背景*

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.2 80x86汇编与c语言-2（续） - 条件移动指令的体系结构背景-2

微体系结构背景*

这个处理器啊我可以同时读取多条指令进入这个流水线就是我一下子比方读取不是读取一条指令不是说一个circle读取一条指令让它进流水线是一个circle读多条指令进流水线那么在这种情况下的话呢可能会多达几十条到上百条的指令同时在流水线里面运行同时在流水线里面运行当然一方面来说这是个好事情因为你的吞吐率提高了

但是对于一个跳转指令尤其是那种条件跳转指令会迎来一个问题这什么意思呢大家想想看啊条件跳转指令它非常关键它就决定就是我这条指令的下一条指令是连着往下走呢还是跳到我的一个目标地址去但这样一来就有个问题了

比方说咱们以上面这段作为一个例子就是说因为我现在把程序的执行分成多个流水段也就是说一条条件跳转指令进来之后呢我不是立刻就能知道这条条件跳转指令是应该是要跳转还是不跳转我可能得等它到了流水线的中间或者某些甚至比较靠后的部位我才知道那这样一来的话呢你这条指令紧接着以后的指令该怎么取就成了一个问题了

对就成一个问题这是一个很大的一个问题就是我就顺着走呢还是说我就认为它会跳那这个时候就犹豫因为我不知道流水线本来是紧跟着一排排走的条件跳转指令一进去后面马上要去取址了但现在怎么取是个问题就流水线会带来这个问题那么这个时候呢就是说一个笨办法就是说我就不取了我一看它是条这个条件跳转指令我就不取等着等着它出结果完后我再去跑当然这样子的话呢就是太浪费了

当然有种做法就怎么着呢我就相当于我就搏一把我就赌它是跳还是不跳如果是我赌它不跳那我就挨个取那这样呢也会有问题如果它跳转了呢那么你取的这些指令全部作废就cancel重新来过那么尤其在你深度流水线就多发射结构下你一下子把这么多指令cancel掉这个效率是很低的这个效率很低可能会有几十条指令执行效率很低

所以这种情况下的话呢就是说面临一个问题就是条件跳转指令呢有可能会引起一定的性能损失即使你啊如果等着它出结果一直不动那就是笨办法那肯定是损失那或者你就猜一下那猜错了的话呢也会有性能损失所以呢就需要尽量消除大概就这个意思啊不知道我又没有说明白

条件跳转指令往往会引起一定的性能损失，因此需要尽量消除。

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

那么，怎么去消除它呢？就用条件转移指令。相当于用 1 条条件转移指令，来替换 1 条条件跳转指令，就是condition move那条指令。

回想下刚才的代码段，在那个里头，指令完全是顺序执行的，一直顺序执行，没有任何的branch。

所以相当于把这条条件跳转指令取消掉了，代之以 1 条条件转移指令。

但是条件转移指令也有很大的局限性。

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

(详细原因看视频)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.3 80x86汇编与c语言-2（续） - 循环的汇编语言表示-1

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

“Do-While”循环

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.4 80x86汇编与c语言-2（续） - 循环的汇编语言表示-2

“While” 循环(版本1)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

“While”循环（版本2，do-while模式）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

“For”循环

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

“For” –> “While” –>“Do-While”

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

补充

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.5 80x86汇编与c语言-2（续） - 循环的汇编语言表示-3

“While”循环-版本3(jump-to-middle)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

Jump-to-Middle 实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

“For”–>“While”(Jump-to-Middle)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

Jump-to-Middle模式

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.6 80x86汇编与c语言-2（续） - 循环表示的体系结构背景

微体系结构背景*

咱们还得讲讲看就微体系结构背景这一块就是我们就接着刚才说的那个往下说条件跳转指令我们讲过啦往往会引起一定的性能损失所以呢要想办法消除它那怎么消除呢一个方法就刚才说过了 conditional move 但它的使用范围是有限因为很多情况下实在是消除不了消除不了那消除不了怎么办呢就是猜我们刚才讲过了跳还是不跳是个问题那我们就猜一下怎么猜呢用Branch Prediction来猜就是跳转的预测跳转预测实际上这个东西实际上也非常简单啦

我们看这个表当然我们简单讲一讲实际上它就引入了一个跳转的 Branch Prediction的一个table 一个表来进行预测那怎么个预测法呢就历史上假设你这条指令就是一个就你这条指令就是什么叫你这条指令呢就是说就这个地址里头存放的就是一条branch指令我只要历史上只要跑过一次我就给它记下来了记下来怎么记呢就是我把它的这个

你看这是一个表嘛表主要分成左右两大项但当然实际上右边还有一小列左边Lock up这一项是什么呢这是你的这个跳转指令的一个pc地址你通过pc地址来判断你这条指令以前是不是曾经被我们执行过条件跳转的话左边这一列啊实际上就放的是你这个执行过的那些条件跳转指令的那个它的pc以及它的地址右侧是什么呢就是你这条条件跳转指令只要你历史上曾经执行过那么它是跳还是不跳呢如果你跳了那么你跳的目标地址我就给你记下来放在相关栏的右侧然后最右边还有一小列比较窄这一列就说明什么呢就是说我这次是预测你是跳还是不跳

那怎么个预测思路呢实际上非常非常简单咱们讲讲原理啦非常非常简单就是说我就根你的历史信息来完成预测啦就历史上你跳了上一次你跳了比如说我只有一位来记录你上次跳还是不跳那如果你上次跳了那就置1 那这次我还是猜你跳你上次没有跳那我就给它置0 你这次还是猜你不跳就根据历史信息来当然如果我猜错了那我就把它0转换成1了然后下次再来的时候那么发现它状态是1 那我就给它跳实际上就这样子当然你这个预测位数可以扩展就一位的话可能精度不够可以扩展有些状态就在里面进行处理

总的来说呢就根据你的历史信息来判断你这条指令如果是branch指令的话那是跳还是不跳就根据历史信息来历史上跳那就让它跳历史上如果不跳那可能就是不跳当然逻辑可能跟它不一样就这个来法

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

Branch Prediction

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.7 80x86汇编与c语言-2（续） - Switch的汇编语言表示-1

Switch 语句

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

我们说这怎么用跳转表来实现 switch case呢实际上这个来法啊其实我们之前首先有一个这么个概念啊这是左侧相当于是switch case的一个它的C的代码然后呢对每个case的处理啊是由一个指令段来进行处理一个Block来进行处理的

那我们这么想啊针对不同的x 实际上我们要针对这个x值跳到不同的这个指令段的入口地址那可以这么想象 C代码编译出来之后就是变成一段一段的汇编代码嘛汇编代码它实际上在内存里面占据了一定的地址它程序执行的时候在内存里面肯定占据了一定的地址空间那么它这个代码的起始地址那就是这段代码的入口咯

那么我们就可以专门创建一个Jump Table 把你各个的 case下面的处理代码的入口地址搁到这个Jump Table里面去这就形成了一个Jump Table表然后大家可以想象因为你这个咱么说这个x这个取值啊刚才说过了1 2 3 4没有 5 6 还是比较小而且比较连续的所以的话呢我们就可以根据这个x这个值把x的值作为Jump Table的一个下标相当于你这 table这个表嘛表里面连续的放了几个入口地址嘛然后你就可以把x作为这个访问这个表的下标把这个下标所对应的这表项里面那个项读出来这个读出来的这个项就是你跳转的的目标地址呗这个就跳转表的工作原理嘛

3.3.8 80x86汇编与c语言-2（续） - Switch的汇编语言表示-2

Switch 语句示例(x86-32)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

表结构

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.3.9 80x86汇编与c语言-2（续） - Switch的汇编语言表示-3

表项内容

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64 下的Switch语句

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

Switch语句实例（case值很稀疏）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

举个switch语句的一个实例这个case的值啊很稀疏也就是说从0 111 222 就间隔太大一直到这个999然后就default 那这个呢就不太适合用条件跳转表啦

实际上条件跳转表适合用于什么呢就是说你的取值比较密就你111 这个数比较大但不怕只要你111 112 113这样也行

你怕就怕什么啊 111 222 333 每次都加一百多个那这样的话呢你的跳转表就太大啦占太大空间啦实际上你有效的项没多少个一般都是default 写了那么多项实际上都是default 实际上这个不太合适那么这样的情况下呢那就没办法就不适合用跳转表啦

x86-32下的实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

一般来说呢就是以二叉树的组织结构呢挺明显的就编译器还是比较聪明的就是针对这种比较简单的switch case 它的取值比较稀疏范围比较大的话呢 OK 我们通过二叉树方式比较均衡的二叉树这样的话呢就使得就是我平均的判断次数能够最少达到我的目的就这么个来法

小结

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

条件码是什么东西条件码实际就是处理器的状态的一部分用于表示最近那条执行指令的某些结果的一些状态它的结果是0 非0 大于0小于0或者溢出或者这溢出呢还可以分成就是说是这个无符号数还是带符号数的溢出各种条件码都给你设好了那么相关的怎么进行设置读取就set x里的一些指令

3.4 80x86汇编与C语言-3

3.4.1 80x86汇编与c语言-3 - 程序运行栈的基本操作-1

x86-32的程序栈

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

压栈操作

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

压栈是怎么来法呢压栈指令只有一个操作数就是src src是一个合法的你可以是一个寄存器也可以是一个立即数可以是一个合法的寻址一个地址访问模式这条指令的语义是从src取得操作数操作数取出来之后我把esp减4 减4是什么意思呢就是压栈 esp指向栈顶减了4它就往下走往下走就是压栈的意思栈顶往下走像这属于压栈然后呢再把你取入那个操作数写入栈顶地址写入esp所指向的内存地址把它写进去用户把esp减4 把数据写进去相当于做了一个压栈操作压栈push

出栈操作

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

pop实际上就是一个反操作压进去再把它弹出来实际上刚好相反它就是读取栈顶数据读取esp所指向的那个地址里头的数据然后esp加4 加4是出栈嘛把数据弹出来了呗然后把你读取的栈顶数据写入destination 写入目标操作数

3.4.2 80x86汇编与c语言-3 - 程序运行栈的基本操作-2

过程调用

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

这个有个过程调用有个叫call call什么意思呢就是这边调用了call指令 call有点像个drop 我要跳到你这个目标地址目标地址相当于你的操作数在跳之前我要把返回地址压栈这跟drop不一样 drop跳过之后我不用顾着返回你函数调用会有个return 所以在跳之前要把我的返回地址压入栈什么叫返回地址就是你call指令后面的那条指令这个地址给它压到栈里头以便返回比方说这边就给个实例如果说call 后面实际上就给出了地址相当于我要drop过去 drop之前我把后面的这条push指令的地址把它压栈这就是我的return address 那么相反的你只要有call 那就有return return什么意思呢也可以理解为跳转跳转地址在哪里呢跳转至当前栈顶 esp所指向的那个内存地址里边所存的地址把它取出来就是我的目标对象跳到那边去就是这样子

过程调用实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.4.3 80x86汇编与c语言-3 - 过程调用与栈

基于栈的编程语言

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

连续过程调用示例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

栈帧（stack frame）

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

过程调用时栈的变化

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

esp ebp永远遵循的规律我要指向当前正在运行的那个函数的它的栈帧的两头所以它是往下走了一格就这样子

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

ebp esp还是遵循刚才那个的规律它要指向当前正活跃正在被运行的那个过程的栈帧的两头

(这一小节建议观看视频中的动画，加强理解。)

3.4.4 80x86汇编与c语言-3 - 栈帧

x86-32/Linux 下的栈帧

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

栈帧当然怎么定义基本上定义为就是说把某个函数或者某个过程调用它的子过程的一些参数也算作是你的过程栈帧的一部分但还有一种定义方式我把你调用参数算成是你的子过程那这样我们就可以往上看就是说你当前栈的内容你可以看成我有局部变量有old ebp 有return address 还有父过程给我的参数这也可以只是个定义的问题

3.4.5 80x86汇编与c语言-3 - 一个实例

回顾下swap过程

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Setup #1

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Setup #2

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Setup #3

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Finish #1

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Finish #2

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Finish #3

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

swap Finish #4

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.4.6 80x86汇编与c语言-3 - 寄存器使用惯例

寄存器的使用惯例

两个过程之间会有个调用关系我们以前就提到对于C程序而言从main函数开始一个函数调用另外一个过程那么在这种情况下呢大家从刚才例子里面已经看到了这个通用寄存器的个数的限制是非常有限的 32位就8个 64位是16个那么在这种情况下呢每个过程都可能使用这些通用寄存器非常普遍的使用那么在这种情况下呢子过程如果使用了一定的通用寄存器那么可能这些通用寄存器也非常有可能是父过程使用过的那么这两者之间 子过程在使用之前应该说保留这些通用寄存器的值在它退出的时候呢再进行恢复 这是应该这么做

但是具体怎么去做这个事呢那一个笨办法如果没有任何约定的话那笨办法就是什么就是一个过程对吧就是把它所有使用的通用寄存器都保留一遍那这样的是一种效率不高的方法因为你所使用的通用寄存器未必你的父过程就一定使用了

所以在这种前提下大家要引入一个约定实际上这是软件层面的一个约定称之为寄存器的使用惯例那怎么个来法呢就是说寄存器要作为程序的临时存储那么子过程父过程或者我们称之为调用者和被调用者它们之间各有各的职责我们把这些通用寄存器分成两类一部分是让调用者来负责保存的来保存和恢复了当然另一部分呢是由被调用者进行保存与恢复

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.4.7 80x86汇编与c语言-3 - 一个递归调用的实例-1

x86-32/Linux 下的使用惯例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

递归调用

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

栈帧的建立（分配）过程

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.4.8 80x86汇编与c语言-3 - 一个递归调用的实例-2

递归体

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.4.9 80x86汇编与c语言-3 - 另一个递归调用的实例-1

带指针的“阶乘”过程

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

创建指针

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

它这边对value做了一个取地址的操作那么在这个情况下编译器就没法把val这个变量放到寄存器里头那怎么办呢只能放到栈帧里头因为它是个局部变量就放到这个函数的栈帧里头因为它需要一个指针嘛

3.4.10 80x86汇编与c语言-3 - 另一个递归调用的实例-2

传递指针

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

我们说leal指令两个作用本分工作是计算地址值第二个就是也能够比较好的参与一些数值的运算它甚至比普通的加减法指令都要方便这个地方当然当作它的本职工作

使用指针

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.4.11 80x86汇编与c语言-3 - x86-32过程调用小结

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.5 80x86汇编与C语言-3（续）

3.5.1 80x86汇编与c语言-3（续） - x86-64过程调用与运行栈-1

x86-64通用寄存器

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64寄存器使用惯例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

这实际上就是X86-64寄存器使用惯例大家看一下好了它里头有6个寄存器是用作这个参数的传递我们可以看到这里边就有6个寄存器那么return value还是默认放到rax里面去

还有一些就是说我们区分了一下剩下这几个标黄的寄存器叫做被调用者(Callee)负责保存与恢复

那么剩下这些比如说像这种rax等包括你的传参的那么这种肯定是调用者保存以及恢复 rbp有点特殊我回头再讲 rsp实际上就是栈顶的寄存器这还是硬件支持的一个栈顶寄存器

除此之外大家都是作为通用寄存器使用当然各有各的分工了但是唯一特殊的rsp rsp还是一个硬件支持的栈顶寄存器就相当于call return这些指令默认地还是操作这些寄存器

3.5.2 80x86汇编与c语言-3（续） - x86-64过程调用与运行栈-2

x86-64 寄存器

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64 下的swap过程-1

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.5.3 80x86汇编与c语言-3（续） - x86-64过程调用与运行栈-3

x86-64 下的swap过程-2

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64 下的swap过程-3

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

这里面呢没有分配栈帧我们看看这个代码首先就是说你看它就把这个这里面就相当于把这个a[i] 这个地址给它取出来然后把a[i+1]这个地址给它取出来然后就call swap 这个里头就是完全没有分配栈帧

这为什么可以这么做呢实际上也简单因为在这里头我们可以看到它所在过程本身它首先第一它没有局部变量而且它也没有对传递给它的参数做什么运算操作就直接两个呢在相当于通过寄存器相关运算把地址算出来之后直接就调用它的子过程在这种情况下呢就不需要分配栈帧就直接call就可以

x86-64 下的swap过程-4

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

这个时候我们看看它编译出来的代码可能是这个样子了就jmp swap 没有用call指令直接用swap 这是可以的为什么

大家想想看因为jmp swap的时候呢就直接相当于你就跳到swap函数的入口然后swap里面执行完之后呢 swap本身有个return 它return到哪去呢因为你的这个函数没有对栈进行任何的修改所以说当时那个rsp 应该还是指向 swap这个swap函数的返回地址那反过来讲的话呢当下面被调用的swap函数它调return的时候实际上它返回的是它的父过程的就是这个函数的返回地址就是从一个从孙子过程可以理解为这是一个父过程这是一个子过程那么上面还有一个祖父过程那么就是相当于直接从一个孙子过程直接返回到祖父过程这个我们完全可以画出layout 出来这个图就是很清楚

3.5.4 80x86汇编与c语言-3（续） - x86-64过程调用与运行栈-4

x86-64 的栈帧使用实例

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

栈操作

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.5.5 80x86汇编与c语言-3（续） - x86-64过程调用与运行栈-5

x86-64下的栈帧的一些不同操作特性

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

x86-64 过程调用小结

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

练习题

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.6 80x86汇编与C语言-4

3.6.1 80x86汇编与c语言-4 - 数组的存储

基本数据类型

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

数组的内存存储

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

数组访问

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.6.2 80x86汇编与c语言-4 - 数组的访问-1

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

数组循环示例(x86-32)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.6.3 80x86汇编与c语言-4 - 数组的访问-2

指针循环示例(x86-32)

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

嵌套数组

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

嵌套数组的这个例子实际上说白了就是二维数字嘛就是二维数字嘛从它低维来看呢就是说它里面每个元素都是一个长度为5的int类型的数字就是高维来看的话所以就称为二维数字

二维数字我们在C里面也学到过对吧二维数字存储呢就是说它是按行来存储第一行第二行第三行第四行这么来存第0行第i行和第i加1行呢因该是连续存储的这个很清楚的我们在C里面应该有这么一个概念它是连续存储的就是实际上随着指针的移动可以访问完第一行之后也可以访问第二行了

3.6.4 80x86汇编与c语言-4 - 数组的访问-3

访问嵌套数组中的“行”

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

访问嵌套数组的单个元素

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

3.6.5 80x86汇编与c语言-4 - 数组的访问-4

Multi-Level Array

《汇编语言程序设计》学习笔记（3）三、C与汇编语言

Multi-Level数组这一例子什么意思呢就说我们定义了一个指针数组就是它数据长度啊数组长度为3 这应该university 它数据长度数组长度为3 它的每个元素实际上是个指针每一个指针又指向了一个长度为5的一个int类型的数组实际上就变成这个样子就2层第一层是个数组它里面的数组啊实际上是个指针是个地址这个地址又指向另外一个整数类型的这个数组