理解写时复制（Copy-on-Write）

三月 26, 2018

Copy-on-Write（缩写为 COW）是一种优化策略，核心思想是：共享 → 复制，但等到真正需要修改时才复制。

一个形象的例子

想象你有一本书的复印件 A。现在有人想借这本书：

只有对方尝试修改（写）时，才真正分配新内存、复制内容。

npm 在安装包时（Linux 环境下），会利用 COW 文件系统（Btrfs、XFS、overlayfs 等）的特性：

这是 npm v7+ 优化安装速度和磁盘占用的重要手段。

Unix 创建进程时，fork() 调用后子进程共享父进程的内存页，只有在任一方尝试写入时才会真正复制。这大大加快了进程创建速度——Linux 的 fork() 因此能够极快完成。

Btrfs、ZFS、XFS 等文件系统默认启用 COW：

容器镜像的每一层就是 COW 的概念：

PostgreSQL 的多版本并发控制（MVCC）使用了类似 COW 的思路：

SQLite 也是类似，写操作不覆盖原数据，而是创建新 page。

虚拟机快照的原理：

COW 的本质是：能共享受用，写了才复制。

这种"延迟分配"的优化策略，在所有"共享一份实体、按需复制"的场景都能看到——从进程创建、文件系统、包管理器到数据库，无一例外。

适用于读多写多、共享资源粒度细、复制成本高的场景。如果频繁写入，反而会触发大量复制，失去意义。