Mach-O 文件是通往系统底层的基础，如果要深入理解 App 的启动加载原理，又或是想做深层次的 App 优化，熟悉 Mach-O 是非常必要的。

Mach-O (Mach Object)是一种 iOS 和 MacOS 上的原生二进制文件，类似于 Windows 里面的 PE 和 Linux 里面的 ELF，弄清楚 Mach-O 的结构和加载可以从根本上理解以下技术点：

fishhook 原理
二进制重排加快 App 启动速度
常量字符串所属模块甚至所属函数的查找
闪退后，使用 .crash 文件与 dSYM 进行符号恢复

常接触的 Mach-O 文件有：

编译产生的目标文件：目标文件.o
静态/动态库文件： .a、.dylib、.framework
可执行文件：如 .app 包里面的二进制文件
dSYM 文件

本文将从可执行类型的 64-bit Mach-O 文件来展开。来源参考：

头文件：Xcode.app/Contents/Developer/Platforms/iPhoneOS.platform/Developer/SDKs/iPhoneOS.sdk/usr/include/mach-o/loader.h
苹果文档

文件描述

概述

Mach-O 可以按照所包含的架构分类，如arm64、armv7、x86_64，一个 Mach-O 文件可以包含不止一个架构，该 Mach-O 将被称为通用二进制格式，即 FAT 二进制，通用二进制文件的结构和单架构的只有组织方式上有一些区别，根据苹果官网的一张老图，64-bit Mach-O 的主要组成：
Mach-O 结构1

Header: 位于文件的开始部分，包含二进制的标记信息：类型架构、CPU 类型、文件类型、加载命令的个数等，表明自身的文件属性，方便操作系统内核知道接下来能用什么方式来加载和处理该文件。其中文件类型有目标文件、可执行文件、动态库、动态链接器、dSYM 等。
Load Commands: 紧跟在 Header 的后面，它描述了 segment（段）、符号表、系统动态链接库等的加载，每一个Load Commands都包含有命令类型、占用空间大小、名字等基本信息，不同的数据类型使用不同的加载命令表示。这是和加载（内存映射）相关的区域，操作系统内核为了提高加载效率减少页内碎片，要求每一个段被映射到虚拟内存后所占空间需要按照 PAGESIZE 进行对齐。
Data: 这部分主要存放我们的程序指令和程序所用到的变量、类、方法等，另外还有和装载内存映射相关的 Rebase、Binding、符号表、字符串表等信息。

整体结构

整个文件的结构大致为：
Mach-O 结构2

Mach-O 结构

和 Mach-O 结构相关的数据结构在<mach-o/loader.h> 和 <mach-o/fat.h>中可以找到，其中 64-bit 的 Header 结构：

struct mach_header_64 {
	uint32_t	magic;      /* 魔数，操作系统加载器将根据这个字段决定后续如何识别和加载该二进制 */
	cpu_type_t	cputype;	/* CPU 类型标识*/
	cpu_subtype_t	cpusubtype;	/* CPU 子类型标识 */
	uint32_t	filetype;	/* 文件类型 */
	uint32_t	ncmds;		/* 加载命令的数量 */
	uint32_t	sizeofcmds;	/* Load Commands 在文件中占据空间大小*/
    /** 描述文件在编译、链接过程中的信息，比较重要的标志位有
     * MH_DYLDLINK: 该文件需要交给 dyld 处理，无法被静态链接
     * MH_PIE: 只在可执行的 Mach-O 中出现，表明操作系统将对主程序启用
     *          地址空间布局随机化
     * MH_TWOLEVEL: 表明当前文件使用了两级命名空间
    */
	uint32_t	flags;		
	uint32_t	reserved;	/* reserved */
};

紧接在 Header 后面的是 Load Commands，其中 LC_SEGMENT_64 数据结构如下

struct segment_command_64 {
	uint32_t	cmd;		/* 表示将这个64位的段映射到进程地址空间的命令 */
    /** 一个 command 在文件中所占空间大小。 
     * 操作系统会根据 cmd 的类型来使用相应的 segment_command 数据类型来承接当前 segment，
     * 而 Mach-O 是基于二进制字节流存储的，
	 * 所以 cmdsize 其实就是不同的 segment_command 数据类型所占空间的大小
    */
	uint32_t	cmdsize;	
	char		segname[16];/* 段名字，一般是两个下划线开头后跟大写字母 */
	uint64_t	vmaddr;		/* 段被映射到虚拟内存空间后的起始地址， ASLR 就在这里起作用*/
	uint64_t	vmsize;		/* 段被映射到虚拟内存空间后的大小，这个大小一定是 PAGESIZE 的整数倍 */
	uint64_t	fileoff;	/* 段在文件中的偏移 */
	uint64_t	filesize;	/* 段在文件中的所占空间大小 */
	vm_prot_t	maxprot;	/* 最高级别内存保护标识 */
	vm_prot_t	initprot;	/* 段所在页原始内存保护标识 */
	uint32_t	nsects;		/* section 数量，有的段没有 section */
	uint32_t	flags;		/* flags */
};

常见的加载命令cmd

command 类型	解释
`LC_SEGMENT_64`	将当前段中的数据加载并映射到内存
`LC_CODE_SIGNATURE`	获取应用的签名信息
`LC_UUID`	当前文件的唯一标识，可与 dSYM 做匹配用做符号还原
`LC_LOAD_DYLIB`	需要加载的动态库
`LC_LOAD_DYLINKER`	用来加载动态库的程序，一般指明 `/usr/lib/dyld`
`LC_MAIN`	主程序的入口
`LC_VERSION_MIN_IPHONEOS`	二进制要求的最低操作系统版本
`LC_DYLD_INFO_ONLY`	描述重定向地址、弱引用地址、懒加载绑定等的偏移值信息

其中 LC_SEGMENT_64 的子类型有：

__PAGEZERO: 操作系统给当前程序预留的虚拟的“保护空间”，64-bit OS 的该空间大小为 4GB，该区域对于当前程序来说不可读不可写不可执行，即所有代码和数据的加载、执行、写入操作都只能在这 4GB 空间以后的地址上进行，否则将引发异常
__TEXT: 保存程序的代码、OC 相关的类和方法信息、包含在双引号中的常量字符串信息，另外 __TEXT 还预留了动态动态链接库的符号修正信息(__stub)
__DATA: 程序的数据段，可读可写
__LINKEDIT: 包含动态链接相关的所有信息，之前提到的重定向地址、弱引用地址、懒加载绑定信息的索引都存储在这里

一个 Mach-O 二进制程序的 __DATA 和 __TEXT 段在更细的维度上会被分成不同的 section，这么设计的目的应该是为了提高内存使用效率。在同一个段的同一个 section 中可以使用相同的权限控制，例如对于 __TEXT 段包含代码和常量，是 readonly 的，对于动态链接库来说，操作系统内核在加载这部分数据到内存时，只需要加载一份就可以被所有的进程按需共享；而且由于是只读的，相对于可写可读的__DATA段，操作系统内核不用考虑是否因为数据污染而需要重新加载一个干净的 page；当内核需要收回部分内存时，对于 __TEXT 的页，可以直接标记为丢弃，而不用考虑是否要将变化后的数据保存起来。
这也暗示着我们写代码时尽量将不会发生变化的全局变量申明为 const 让其保存在只读区域，能提高内存访问效率，尤其是对于内存区域可能会被共享的动态库

结构验证

为了加深理解，下面将通过代码和 MachOView 来探索一个 Demo Mach-O 的 Header 和 Load Commands

环境准备

用 Xcode 新建一个 Mac Command Line 程序，名为 MachOExploration，然后再添加一个 iOS Single View App 类型的 target，名为 HelloWorld，然后在 TARGETS -> HelloWorld 的 Build Phases 中新建一个脚本New Run Script Phases，将 Shell 修改为 /usr/bin/python3，然后添加如下脚本

import os
import shutil

product_dir = os.environ["BUILT_PRODUCTS_DIR"]
executeable_path = os.environ["EXECUTABLE_PATH"] 
executeable_abs_path = os.path.join(product_dir,executeable_path)
executeable_name = os.environ["EXECUTABLE_NAME"]
project_dir = os.environ["PROJECT_DIR"]
des_exe_path = os.path.join(project_dir,executeable_name)

shutil.copy2(executeable_abs_path, des_exe_path)

这样运行 HelloWord 工程后，将会有一个二进制文件被复制到工程中，方便后续分析

读取文件时，为了合理利用内存，选择使用文件指针来操作文件而不是一次性将文件载入内存：

1
2
3

uint32_t magic1;
NSString *machoFilePath = @"path/to/mach-o/file";
FILE *fp = fopen(machoFilePath.UTF8String, "r");

由前面的分析可知，主要是基于文件的偏移和大小来得到指定数据，所以定义一个工具函数：

void *load_bytes(FILE *fp, int offset, int size) 
{
    void *buf = calloc(1, size);
    if(!buf) {
        return NULL;
    }
    fseek(fp, offset, SEEK_SET);
    fread(buf, size, 1, fp);
    return buf;
}

读取 Header

1
2
3

uint32_t *magic = load_bytes(fp, 0, sizeof(uint32_t));
NSLog(@"%X",*magic);
free(magic);

得到魔数为 FEEDFACF，即 64-bit Mach-O，且不需要大小端转换，接下来使用 struct mach_header_64 类型加载 Header 信息：

void load_header_64(FILE *fp)
{
    struct mach_header_64 *header = load_bytes(fp, 0, sizeof(struct mach_header_64));
    NSLog(@"magic:%X",header->magic);   // FEEDFACF
    NSLog(@"cputype:%d",header->cputype); // 16777228 = CPU_TYPE_ARM64;
    NSLog(@"cpusubtype:%d",header->cpusubtype); // 0 = CPU_SUBTYPE_VAX_ALL;
    NSLog(@"filetype:%d",header->filetype); // 2 = MH_EXECUTE;
    NSLog(@"ncmds:%d",header->ncmds); // 21
    NSLog(@"sizeofcmds:%d",header->sizeofcmds); // 2704
	/// 2097285 = (flags & MH_TWOLEVEL) | (flags & MH_PIE) |
    ///           (flags & MH_DYLDLINK) | (flags & MH_NOUNDEFS)
    NSLog(@"flags:%d",header->flags); // 2097285
    NSLog(@"reserved:%d",header->reserved); // 0
    free(header);
}

上述宏定义可以在 iPhoneOS.sdk/usr/include/mach-o/loader.h 和 MacOSX.sdk/usr/include/mach/machine.h 查到
将 Demo Mach-O 拖入到 MachOView 中可以验证：

读取 Load Commands

Load Commands 紧跟在 Header 的后面，所有的 Load Commands 都“继承”自同一个基结构体，先用这个基结构体去套取数据以得到 load command 的类型，然后选用合适的类型读取完整的数据

// 基结构体
struct load_command {
	uint32_t cmd;		/* type of load command */
	uint32_t cmdsize;	/* total size of command in bytes */
};

读取代码

uint32_t ncmds = header->ncmds;

// 加载 Load Commands
uint32_t lc_offset = sizeof(struct mach_header_64);
for (NSInteger i = 0; i != ncmds; ++i) {
	struct load_command *lc_base = load_bytes(fp,lc_offset,sizeof(struct load_command));
	load_commands_handler(lc_base, fp, lc_offset);
	lc_offset += lc_base->cmdsize;
	free(lc_base);
}

读取到的基结构后，使用完成的结构体套取完整数据：

void segment_64_load_handler(FILE *fp, uint32_t offset)
{
    struct segment_command_64 *sc_64 = load_bytes(fp, offset, 
                                        sizeof(struct segment_command_64));
    NSLog(@"cmd:%d",sc_64->cmd);
    NSLog(@"cmdsize:%d",sc_64->cmdsize);
    NSLog(@"segname:%s",sc_64->segname);
    NSLog(@"vmaddr:%llu",sc_64->vmaddr);
    NSLog(@"vmsize:%llu",sc_64->vmsize);
    NSLog(@"fileoff:%llu",sc_64->fileoff);
    NSLog(@"filesize:%llu",sc_64->filesize);
    NSLog(@"maxprot:%d",sc_64->maxprot);
    NSLog(@"initprot:%d",sc_64->initprot);
    NSLog(@"nsects:%d",sc_64->nsects);
    NSLog(@"flags:%d",sc_64->flags);
    free(sc_64);
}

void dyld_info_command_handler(FILE *fp, uint32_t offset)
{
    struct dyld_info_command *dyld_c = load_bytes(fp, offset, 
                                        sizeof(struct dyld_info_command));
	// 使用 %d 打印会溢出
    // 2147483682 = (0x22 | LC_REQ_DYLD) = (0x22 | 0x80000000) = LC_DYLD_INFO_ONLY
    NSLog(@"cmd:%@",@(dyld_c->cmd)); 
    NSLog(@"cmdsize:%d",dyld_c->cmdsize);
    NSLog(@"rebase_off:%d",dyld_c->rebase_off);
    NSLog(@"rebase_size:%d",dyld_c->rebase_size);
    NSLog(@"bind_off:%d",dyld_c->bind_off);
    NSLog(@"bind_size:%d",dyld_c->bind_size);
    NSLog(@"weak_bind_off:%d",dyld_c->weak_bind_off);
    NSLog(@"weak_bind_size:%d",dyld_c->weak_bind_size);
    NSLog(@"lazy_bind_off:%d",dyld_c->lazy_bind_off);
    NSLog(@"lazy_bind_size:%d",dyld_c->lazy_bind_size);
    NSLog(@"export_off:%d",dyld_c->export_off);
    NSLog(@"export_size:%d",dyld_c->export_size);
	free(dyld_c);
}

void load_commands_handler(struct load_command *lc_base, FILE *fp, uint32_t offset)
{
    NSLog(@"--------------------------------");
    uint32_t cmd = lc_base->cmd;
    switch (cmd) {
        case LC_SEGMENT_64:
            segment_64_load_handler(fp, offset);
            break;
        case LC_DYLD_INFO_ONLY:
            dyld_info_command_handler(fp, offset);
            break;
        default:
            break;
    }
}

完整代码在这里，后续基本上都是这种模式，根据偏移值和定义来获取数据，这里不再继续解析了。

一点感触

读取 Mach-O 文件的精髓是偏移 + struct，struct 真是访问字节流内容的神器：

在探索 oc 底层结构时，打印 Class 类型的 isa 指针时，由于某些原因（暂时未知）不能直接 lldb po 出来，这时可以定义一个和类对象一样结构的结构体来套取 isa 指针)。

oc 的 block 转成 c++ 代码后，有一个代表 block 的基本结构的类型 struct __block_impl:

struct __block_impl {
	void *isa;
	int Flags;
	int Reserved;
	void *FuncPtr;
};

还有代表当前完整内存结构的 block struct __main_block_impl_0(名字可能不一样)，这两个是包含关系：

struct __main_block_impl_0 {
	struct __block_impl impl;
	struct __main_block_desc_0* Desc;
	__Block_byref_age_0 *age; // block 捕获的变量，封装成了结构体
	__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, 
                       __Block_byref_age_0 *_age, int flags=0) : 
                                           age(_age->__forwarding) {
		impl.isa = &_NSConcreteStackBlock;
		impl.Flags = flags;
		impl.FuncPtr = fp;
		Desc = desc;
	}
};

对于一块具体的 block 内存来说无论是通过 struct __block_impl * 还是 struct __main_block_impl_0 * 都是可以合法访问的，区别是当涉及到基本 block 属性的操作时使用 struct __block_impl * ，当涉及到具体 block 属性操作时使用 struct __main_block_impl_0 *，最大化地精炼和减少额外开销