1.字节序
CPU的字节序分为LittleEndian和BigEndian。
所谓Endian,就是多字节数据在内存中的排列方式。
例如,假设有一个整数0x11223344:
LittleEndian的排列方式是,从内存的低地址开始,依次存放 0x44 0x33 0x22 0x11;
BigEndian的排列方式是,从内存的低地址开始,依次存放 0x11 0x22 0x33 0x44。
Intel架构采用LittleEndian,其他的比如SPARC、MIPS架构采用BigEndian。
2.32位环境中的寄存器
32位环境中的寄存器有以下一些。
(1)8个32位通用寄存器
8个32位通用寄存器分别为 EAX、EBX、ECX、EDX、ESI、EDI、EBP、ESP。
ESP寄存器用于保存栈指针。
某些命令使用特定的寄存器。例如,字符串命令将ECX、ESI和EDI寄存器作为操作数使用。
8个通用寄存器的主要用途如下:
EAX 操作数的运算、结果
EBX 指向DS段中数据的指针(见下文段寄存部分)
ECX 字符串操作或循环的计数器
EDX 输入输出指针
ESI 指向DS寄存器所指示的段中某个数据的指针,或者是字符串操作中字符串的复制源(source)
EDI 指向ES寄存器所指示的段中某个数据的指针,或者是字符串操作中字符串的复制目的地(destination)
ESP 栈指针(SS段)
EBP 指向栈上数据的指针(SS段)
但是,通用寄存器的用途并不限于上面所述,也可以用于一般用途,所以以上只作为参考。
(2)6个16位段寄存器
主要段寄存器的用途如下:
CS 代码段
DS 数据段
SS 堆栈段
ES 数据段
FS 数据段
GS 数据段
程序代码放在代码段中,数据放在数据段中,程序所用的栈放在堆栈段中。
(3)1个32位EFLAGS寄存器
EFLAGS寄存器中包含状态标志(status flag,简写 S)、控制标志(control flag,简写 C)、系统标志(system flag,简写 X)。
EFLAGS寄存器各bit标志如下:
bit_0 S 进位标志(CF)
bit_1 保留
bit_2 S 恢复标志(PF)
bit_3 保留
bit_4 S 辅助标志(AF)
bit_5 保留
bit_6 S 零标志(ZF)
bit_7 S 符号标志(SF)
bit_8 X 跟踪标志(TF)
bit_9 X 终端许可标志(IF)
bit_10 C 方向标志(DF)
bit_11 S 溢出标志(OF)
bit_12 + bit_13 X I/O特权域(IOPL)
bit_14 X 嵌套任务标志(NT)
bit_15 保留
bit_16 X 恢复标志(RF)
bit_17 X 虚拟8086模式标志(VM)
bit_18 X 对齐检查标志(AC)
bit_19 X 虚拟中断标志(VIF)
bit_20 X 虚拟中断等待标志(VIP)
bit_21 X 识别标志(ID)
bit_22 ~ bit_31 保留
保留的bit位不能使用,必须设置到之前读入时的位置。
(4)1个32位EIP寄存器
EIP(Instruction Pointer)寄存器是32位指令指针。
(5)其他寄存器
除了以上4类常见的寄存器,还有控制寄存器(CR0~CR4)、GDTR、IDTR、TR、LDTR、调试寄存器(DR0/DR1/DR2/DR3/DR6/DR7)、内存类型范围寄存器MTRR、MSR(Model Specific Register)寄存器、机器检查寄存器(Machine Check Register)、性能监视计数器(Performance Monitoring Counter)、FPU寄存器、MMX寄存器、XMM寄存器等等。
3.64位环境中的寄存器
这些寄存器支持的地址空间为2^64字节。利用CPUID指令可以查看运行中的处理器支持的物理地址空间。
64位模式下的通用寄存器在处理32位操作数时,可以通过
EAX/EBX/ECX/EDX/EDI/ESI/EBP/ESP/R8D~R15D来使用。处理64位操作数时,可以使用
RAX/RBX/RCX/RDX/RDI/RSI/RBP/RSP/R8~R15。其中,R8D~R15D和R8~R15是新的通用寄存器。RIP寄存器是64位指令指针。
栈指针和控制寄存器都可以扩展到64位,并增加了CR8寄存器。而且,调试寄存器也可以扩展到64位,GDTR、IDTR可以扩展到10字节,LDTR、TR可以扩展到64位。
4.地址
CPU可以通过内存总线访问到的地址为物理地址。
32位模式下最大为64GB(2^36)。
64位模式下最大为2^40(Intel)和2^48(AMD)。
(1)内存地址的平坦模型
该模型下,内存可以看做单一、平坦的连续地址空间,称为线性地址。Linux采用这种内存模型。
(2)内存地址的分段模型
该模型下,内存被看做被称为“段”(segment)的独立地址空间的集合,通过段选择器和偏移量组成的逻辑地址来访问段内地址。首先用段选择器识别出要访问的段,然后通过偏移量找到该段的地址空间中的内存。
32位模式下最多能指定16383个段,各段的最大大小为2^32字节。
64位模式下采用了平坦模型,因此可以使用64位线性地址。不能使用分段式内存模型。
5.数据类型
基本数据类型包括字节(8比特)、字(16比特)、双字(32比特)、四字(64比特)和双四节(128比特)。
(1)整数数据类型
支持无符号整数和有符号整数。
无符号整数的范围为0~最大整数,根据选择的操作数大小(字节、字、双字或四字)进行编码。
有符号整数能够表示整数和负数,采用补码表示。
(2)浮点数据类型
支持单精度浮点数、双精度浮点数和扩展精度浮点数。
单精度浮点数(32位)的精度为24比特;
双精度浮点数(64位)的精度为53比特;
扩展精度浮点数(80位)的精度为64比特。
(3)其他数据类型
其他还有指针数据类型、bit-field(比特域)数据类型、字符串数据类型、压缩SIMD数据类型、BCD和压缩BCD整数数据类型等等。