TLB

📅 2026-03-30 ✏️ 2026-03-30 CS

No related notes

1 · TLB#

https://en.wikipedia.org/wiki/Translation_lookaside_buffer

现代 CPU 使用虚拟内存：每个进程看到的地址都是虚拟地址，必须通过页表（page table） 翻译成物理地址才能真正访问内存。

页表存在主存里，本身就是多级结构（x86-64 通常 4 级）。这意味着每次内存访问都要先做一次 page walk——沿着页表树走 4 次内存读——才能拿到物理地址，然后才去访问目标数据。

一次普通内存访问，变成了 5 次。

冲突在于：虚拟内存提供了隔离和灵活性，但 page walk 的代价让它变得不可接受地慢。

如果每次访存都做完整 page walk，CPU 大部分时间花在”查地址”而不是”用数据”上。

TLB（Translation Lookaside Buffer）是 MMU 中的一个硬件缓存，缓存最近使用过的虚拟地址 → 物理地址映射。

TLB hit：虚拟页号在 TLB 中找到对应条目，直接拿到物理帧号，拼上页内偏移即可访问物理内存。代价约 1 个周期。

TLB miss：TLB 中没有这个映射，需要做 page walk：

TLB miss 的代价远大于普通 cache miss，因为 page walk 本身就需要多次内存访问。

三种方案：

方案	代表架构	特点
硬件管理	x86（CR3 寄存器指向页表根）	CPU 自动 walk 页表，对软件透明
软件管理	MIPS, SPARC	TLB miss 触发异常，由 OS 代码填充 TLB
固件管理	Alpha（PALcode）	类似软件管理，但由固件处理，允许不同 OS 用不同页表格式

x86 用硬件管理，好处是简单且快；软件管理的好处是灵活（OS 可以自定义页表格式和替换策略）。

现代 CPU 通常有多级 TLB，类似 L1/L2 cache 的分层：

以 Intel Nehalem 为例：

进程切换意味着地址空间变了，TLB 中旧进程的映射不再有效。最简单的做法是整体刷新（flush），但代价很高——新进程刚切进来时 TLB 全空，每次访存都是 miss。

优化手段：

ASID（Address Space Number）：每个 TLB 条目带上地址空间标识，只有 ASID 匹配当前进程的条目才有效。切换时不需要 flush，只需切换 ASID
PCID（Process-Context Identifier, x86）：Intel 从 Westmere 开始支持的 12-bit 标识符，允许 TLB 同时保留多个进程的映射
Global 页：标记为 global 的页（如内核映射）在切换时不被刷新

Linux 4.14 开始利用 PCID 避免不必要的 TLB flush，这在 Meltdown/Spectre 补丁（KPTI）后对性能尤为重要。

TLB 条目数量有限（通常几十到几百个）。如果页大小是 4 KiB，512 个 TLB 条目只能覆盖 2 MiB 的内存。

使用大页（x86 上 2 MiB 或 1 GiB）时：

适用场景：数据库、JVM、大内存工作集的应用。

TLB 的位置决定了 cache 使用物理地址还是虚拟地址：

现代 x86 的 L1 cache 通常用 VIPT：TLB 查找和 cache 查找并行进行，不会增加额外延迟。

TLB 是 MMU 中缓存”虚拟地址 → 物理地址”映射的硬件缓存，把原本需要 4 次内存访问的 page walk 压缩到 1 个周期完成。

关键理解点：