linux下汇编语言开发总结（linux编译汇编语言）-FinClip官网

linux下汇编语言开发总结（linux编译汇编语言）

网友投稿 2377 2022-09-14

linux下汇编语言开发总结（linux编译汇编语言）

汇编语言是直接对应系统指令集的低级语言，在语言越来越抽象的今天，汇编语言并不像高级语言那样使用广泛，仅仅在驱动程序，嵌入式系统等对性能要求苛刻的领域才能见到它们的身影。但是这并不表示汇编语言就已经没有用武之地了，通过阅读汇编代码，有助于我们理解编译器的优化能力，并分析代码中隐含的低效率，所以能够阅读和理解汇编代码也是一项很重要的技能。因为我平时都是在linux环境下工作的，这篇文章就讲讲linux下的汇编语言。

一、汇编语法风格

汇编语言分为intel风格和AT＆T风格，前者被Microsoft Windows/Visual C++采用，Linux下，基本采用的是AT＆T风格汇编，两者语法有很多不同的地方。

1. 寄存器访问格式不同。在 AT&T 汇编格式中，寄存器名要加上 '%' 作为前缀；而在 Intel 汇编格式中，寄存器名不需要加前缀。例如：

AT&T

Intel

pushl %eax

push eax

2. 立即数表示不同。在 AT&T 汇编格式中，用 '$' 前缀表示一个立即操作数；而在 Intel 汇编格式中，立即数的表示不用带任何前缀。例如：

AT&T

Intel

pushl $1

push 1

3. 操作数顺序不同。在 Intel 汇编格式中，目标操作数在源操作数的左边；而在 AT&T 汇编格式中，目标操作数在源操作数的右边。例如：

AT&T

Intel

addl $1, %eax

add eax, 1

4. 字长表示不同。在 AT&T 汇编格式中，操作数的字长由操作符的最后一个字母决定，后缀'b'、'w'、'l'分别表示操作数为byte、word和long；而在 Intel 汇编格式中，操作数的字长是用 "byte ptr" 和 "word ptr" 等前缀来表示的。例如：

AT&T

Intel

movb val, %eax

mov al, byte ptr val

5. 寻址方式表示不同。在 AT&T 汇编格式中，内存操作数的寻址方式是

section:disp(base, index, scale)

而在 Intel 汇编格式中，内存操作数的寻址方式为：

section:[base + index*scale + disp]

由于 Linux 工作在保护模式下，用的是 32 位线性地址，所以在计算地址时不用考虑段基址和偏移量，而是采用如下的地址计算方法：

disp + base + index * scale

由此分为以下几种寻址方式：

Intel

AT＆T

内存直接寻址

seg_reg: [base + index * scale + immed32]

seg_reg: immed32 (base, index, scale)

寄存器间接寻址

[reg]

(%reg)

寄存器变址寻址

[reg + _x]

_x(%reg)

立即数变址寻址

[reg + 1]

1(%reg)

整数数组寻址

[eax*4 + array]

_array (,%eax, 4)

二、IA32寄存器

1．通用寄存器

顾名思义，通用寄存器是那些你可以根据自己的意愿使用的寄存器，但有些也有特殊作用，IA32处理器包括8个通用寄存器，分为3组

1) 数据寄存器

EAX 累加寄存器，常用于运算;在乘除等指令中指定用来存放操作数，另外,所有的I/O指令都使用这一寄存器与外界设备传送数据。

EBX 基址寄存器，常用于地址索引

ECX 计数寄存器，常用于计数；常用于保存计算值，如在移位指令,循环(loop)和串处理指令中用作隐含的计数器.

EDX 数据寄存器，常用于数据传递。

2) 变址寄存器

ESI 源地址指针

EDI 目的地址指针

3) 指针寄存器

EBP为基址指针(Base Pointer)寄存器，存储当前栈帧的底部地址。

ESP为堆栈指针(Stack Pointer)寄存器，一直记录栈顶位置，不可直接访问，push时ESP减小，pop时增大。

2. 指令指针寄存器

EIP 保存了下一条要执行的指令的地址，每执行完一条指令EIP都会增加当前指令长度的位移，指向下一条指令。用户不可直接修改EIP的值，但jmp、call和ret等指令也会改变EIP的值，jmp将EIP修改为目的指令地址，call修改EIP为被调函数第一条指令地址，ret从栈中取出（pop）返回地址存入EIP。

三、函数调用过程

函数调用时的具体步骤如下：

1. 调用函数将被调用函数参数入栈，入栈顺序由调用约定规定，包括cdecl，stdcall，fastcall，naked call等，c编译器默认使用cdecl约定，参数从右往座入栈。

2. 执行call命令。

call命令做了两件事情，一是将EIP寄存器内的值压入栈中，称为返回地址，函数完成后还要到这个地址继续执行程序。然后将被调用函数第一条指令地址存入EIP中，由此进入被调函数。

3. 被调函数开始执行，先准备当前栈帧的环境，分为3步

pushl %ebp 保存调用函数的基址到栈中，

movl %esp, %ebp 设置EBP为当前被调用函数的基址指针，即当前栈顶

subl $xx, %esp 为当前函数分配xx字节栈空间用于存储局部变量

4. 执行被调函数主体

5. 被调函数结束返回，恢复现场，第3步的逆操作，由leave和ret两条指令完成，

leave 主要恢复栈空间，相当于

movl %ebp, %esp 释放被调函数栈空间

popl %ebp 恢复ebp为调用函数基址

ret 与call指令对应，等于pop %EIP，

6. 返回到调用函数，从下一条语句继续执行

我们来看两个具体例子，第一个求数组和，

编译成汇编代码

gcc -std=c99 -S -o sum.s sum.c

gcc加入了很多汇编器和连接器用到的指令，与我们讨论的内容无关，简化汇编代码如下：

栈变化过程如下：

执行call指令前执行call指令后

从图中可以看出

1. 数组连续排列，用move指令逐个赋值，读取数组元素方法是，用leal得到数组首地址，再计算偏移量

2. 参数从右往左入栈

3. gcc为了保证数据是严格对齐的，分配的空间大于使用的空间，有部分空间是浪费的

下面这个例子说明了struct结构的实现方法，

编译成汇编代码，简化如下：

栈图就不画了，可以清楚地看出struct跟数组类似，连续排列，通过相对位移访问struct的成员，p->y与*(p+sizeof(p->x))有一样的效果。

四、disassemble和objdump

在linux下有两个跟汇编有重要关系的命令，一个是objdump，另一个是gdb中的disassemble。

objdump帮助我们从可执行文件中反汇编出汇编代码，从而逆向分析工程。

objdump -d sum

部分汇编代码如下

disassemble可以显示调试程序的汇编代码，用法如下

disas 反汇编当前函数

disas sum 反汇编sum函数

disas 0x801234 反汇编位于地址 0x801234附近的函数

disas 0x801234 0x802234 返汇编指定范围内函数

reference：

http://zh.wikipedia.org/wiki/%E6%B1%87%E7%BC%96

http://ibm.com/developerworks/cn/linux/l-assembly/

出处：http://cnblogs.com/coderkian/

微前端架构如何改变企业的开发模式与效率提升

2377 2022-09-14

linux下汇编语言开发总结（linux编译汇编语言）

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计