深入系统设计核心：令牌桶与漏桶算法的全方位实战指南

2026-02-01 18:12:25 0条评论 1次阅读 0人点赞

在我们构建高并发、大流量的分布式系统时，网络流量的管理与控制就像是为一辆高速行驶的赛车安装刹车系统——既决定了系统的稳定性，也决定了用户体验的平滑度。你是否曾想过，当无数请求像潮水般涌来时，我们如何保护脆弱的后端数据库不被冲垮？又或者在视频通话中，如何确保数据包既不丢失又不延迟？

在这篇文章中，我们将深入探讨系统设计面试和实际架构中两个最经典的流量整形与速率限制算法：令牌桶算法 与 漏桶算法。我们不仅会剖析它们的理论原理，还会亲手编写代码实现，并探讨在什么场景下选择哪一个才是最佳实践。准备好和我们一起，揭开流量控制的神秘面纱了吗？

核心概览：我们将探讨什么？

在深入细节之前，让我们先快速浏览一下本文的知识地图，这将帮助我们在脑海中建立一个清晰的知识框架：

原理深度剖析：我们将从零开始构建对这两种算法的认知，理解它们的核心机制。
代码级实现：纸上得来终觉浅，我们将通过 3-5 个实际的代码示例（包括基础版和分布式锁版），让你真正掌握如何落地。
差异对决：我们将从多个维度对它们进行详细对比，帮助你做出架构决策。
场景实战：针对不同的业务痛点，我们将分析哪种算法才是你的“救命稻草”。

—

1 什么是令牌桶算法？
2 什么是漏桶算法？
3 令牌桶 vs 漏桶算法：核心差异与系统设计决策
4 实战场景与最佳实践
5 总结与下一步

什么是令牌桶算法？

令牌桶算法不仅仅是一种限流手段，它更像是一个允许“爆发”的智能调节器。想象一下，我们有一个桶，系统以恒定的速度往里面放入“令牌”。数据包想要通过网络，必须从桶中获取一个令牌。如果桶里有富余的令牌，数据包就可以立即通过；如果桶空了，数据包就必须等待或者被丢弃。

它是如何工作的？

让我们通过三个核心动作来解构它：

令牌生成：这是算法的“心跳”。无论当前网络流量如何，后台都会以固定的速率（例如每秒 100 个令牌）向桶中投掷令牌，直到桶被填满。这就意味着，当网络空闲时，桶里会积攒下大量的“额度”。
流量传输与突发性：这是令牌桶最迷人的地方。如果此时突然来了一波巨大的流量（比如秒杀活动），只要桶里有足够积攒的令牌，这些请求可以瞬间被处理，而无需等待令牌生成。这使得令牌桶非常适合处理突发流量。
速率限制：如果流量持续爆发，桶里的令牌被耗尽，传输速率就会降回到令牌生成的速率，从而保护了系统。

代码实战：实现一个简单的令牌桶

光说不练假把式。让我们用 Python 来实现一个基础的令牌桶限流器。在这个过程中，你会看到我们如何处理并发和计时。

import time
import threading

class TokenBucket:
    def __init__(self, capacity, refill_rate):
        """
        初始化令牌桶
        :param capacity: 桶的最大容量（令牌数）
        :param refill_rate: 令牌生成速率（每秒生成的令牌数）
        """
        self.capacity = capacity
        self.tokens = capacity  # 初始时桶是满的
        self.refill_rate = refill_rate
        self.last_refill_timestamp = time.time()
        # 使用锁来保证线程安全，这在高并发环境下至关重要
        self.lock = threading.Lock()

    def consume(self, tokens_requested=1):
        """
        尝试消费指定数量的令牌
        :param tokens_requested: 需要消费的令牌数量，默认为1
        :return: 如果成功返回True，否则返回False
        """
        with self.lock:
            # 1. 首先根据流逝的时间补充令牌
            now = time.time()
            time_passed = now - self.last_refill_timestamp
            new_tokens = time_passed * self.refill_rate
            
            # 更新桶内令牌数量，不能超过容量
            self.tokens = min(self.capacity, self.tokens + new_tokens)
            self.last_refill_timestamp = now

            # 2. 检查是否有足够的令牌
            if self.tokens >= tokens_requested:
                self.tokens -= tokens_requested
                return True
            else:
                return False

# 实际应用模拟
# 假设我们有一个容量为10，每秒补充5个令牌的桶
bucket = TokenBucket(capacity=10, refill_rate=5)

def simulate_request(request_id):
    if bucket.consume(1):
        print(f"请求 {request_id}: 成功处理 (剩余令牌: {bucket.tokens:.2f})")
    else:
        print(f"请求 {request_id}: 被限流拒绝了")

# 模拟突发流量：瞬间发送15个请求
print("--- 模拟突发流量 ---")
for i in range(15):
    simulate_request(i)

#### 代码深入解析

你可能会问，这里为什么要加锁？在单机多线程环境下，如果不加锁，多个线程同时读取 INLINECODE60d5d3d3 并进行减法操作，会导致“竞态条件”。这就像是两个人同时去取最后一份钱，如果不排队，两个人可能都以为自己取到了。我们在代码中使用 INLINECODE97796e31 确保了原子性。

常见错误：在实现时，很多开发者会忘记在更新令牌数时使用 min(capacity, ...)，导致长时间空闲后，桶内的令牌数无限累加，失去了限流的意义。请务必记得“封顶”。

—

什么是漏桶算法？

与令牌桶不同，漏桶算法的核心思想是“强制平滑”。不管进来的水流多汹涌，出去的水流永远是恒定的。漏桶就像一个缓存队列，请求进来后先入桶，然后系统以固定的速率处理桶里的请求。

它是如何工作的？

我们可以将其分解为以下流程：

传入数据：所有进入网络的流量，无论速率多快，首先都会被扔进“桶”里（实际上是一个队列）。
泄漏过程（恒定输出）：这是算法的“定海神针”。系统以恒定的速率从桶底“漏”出数据包进行传输。无论桶里有多少水，漏出的速度永远不变。
溢出处理：如果进水速度远大于漏水速度，桶终究会被填满。一旦桶满，多余的水（数据包）就会被直接溢出丢弃。这意味着漏桶对突发流量没有任何容忍度，它会无情地削峰。

代码实战：基于队列的漏桶实现

让我们看看如何用代码构建这样一个“无情的”流量整形器。这里我们会使用 collections.deque 来实现高效的双端队列。

import time
import threading
from collections import deque

class LeakyBucket:
    def __init__(self, capacity, leak_rate):
        """
        初始化漏桶
        :param capacity: 桶的容量（最大缓存请求数）
        :param leak_rate: 漏水速率（每秒处理的请求数）
        """
        self.capacity = capacity
        self.leak_rate = leak_rate
        # 使用 deque 作为桶的缓冲区
        self.bucket = deque()
        self.lock = threading.Lock()

    def add(self, request_id):
        """
        向桶中添加请求
        """
        with self.lock:
            if len(self.bucket) < self.capacity:
                self.bucket.append(request_id)
                return True
            else:
                # 桶满了，请求被丢弃（拒绝）
                return False

    def leak(self):
        """
        模拟漏水过程：以固定速率从桶中移除请求
        在实际应用中，这通常在一个独立的线程中运行，或者与处理逻辑结合
        """
        with self.lock:
            if self.bucket:
                # 简单模拟：一次漏掉一个，实际中应根据时间间隔控制
                print(f"处理请求: {self.bucket.popleft()} (当前队列长度: {len(self.bucket)})")

# 模拟场景
leaky_bucket = LeakyBucket(capacity=5, leak_rate=1)

print("--- 模拟漏桶溢出 ---")
# 模拟突发流量：一次性放入10个请求
for i in range(10):
    success = leaky_bucket.add(i)
    if success:
        print(f"请求 {i}: 进入桶中")
    else:
        print(f"请求 {i}: 被丢弃 (桶已满)")

print("
--- 开始漏水处理 ---")
# 模拟处理过程
for _ in range(6):
    leaky_bucket.leak()
    time.sleep(0.5) # 仅为了演示输出节奏

#### 代码深入解析

漏桶的关键在于队列。注意在这个实现中，如果 INLINECODE0adc29ea 返回 INLINECODEed3ce47c，这意味着在入口处就被拦截了。而在漏桶的某些变体中，入口不拦截，而是在处理时检测。上述代码展示了入口丢弃的策略。这种策略对于保护下游服务（如数据库）非常有效，因为它是第一道防线。

—

令牌桶 vs 漏桶算法：核心差异与系统设计决策

既然我们已经了解了它们的原理和代码实现，那么在实际的系统设计中，我们该如何选择呢？让我们通过一个详细的对比表格来深入分析它们的特性差异。

特性

令牌桶算法

漏桶算法 :—

:—

:— 流量处理特性

削峰但保留突发：它允许流量有一定程度的波动，只要在令牌允许范围内即可。

强制平滑：它强制输出速率恒定，无论输入多么波动，输出都是一条直线。 核心机制

令牌控制：数据传输依赖于令牌的存在。没有令牌就不能传输。

队列缓存：数据传输依赖于队列的排队，漏口大小决定输出速率。 对突发流量的响应

友好：如果有积攒的令牌，突发流量可以瞬间通过。适合那种“平时闲，偶尔忙”的场景。

苛刻：突发流量会被填入桶中，如果桶满则直接丢弃。它不希望看到任何形式的流量突增。 数据丢弃策略

等待或拒绝：通常当桶空时，请求可能会等待（阻塞）或直接被拒绝（非阻塞实现）。

溢出丢弃：只有当桶满了（队列满了），新来的数据才会被丢弃。 应用场景定位

速率限制：例如 API 调用限制，防止用户刷接口。

流量整形：例如网卡出口流量控制，确保不造成网络拥塞。 实现复杂度

较高：需要精确计算令牌补充的时间差和数量。

相对较低：本质上就是一个带有固定消费者的队列。

深入思考：什么时候选择哪一个？

这个问题没有标准答案，但我们可以根据以下几个维度来做决策：

你的业务是否容忍突发？

* 如果你希望用户体验流畅，比如在视频播放中允许稍微的突发加载以提高清晰度，或者你的后端能够短暂处理稍高于平均值的流量，选令牌桶。

* 如果你的后端极其脆弱，完全不能接受任何高于阈值的流量，或者你需要严格地计费（按秒计费），选漏桶。

你是为了保护下游还是限制上游？

* 限制上游（客户端限流）：通常用令牌桶。比如 AWS 的 API Gateway，限制每个用户每秒只能发 10 个请求，但允许你稍微快一点发完几次然后停顿。

* 保护下游（服务端限流）：漏桶常用于流量出口整形，确保发送到网络的流量是平滑的，不会在交换机处造成拥塞。

—

实战场景与最佳实践

理论结合实践才是王道。让我们看看在真实的系统设计中，这些算法是如何大显身手的。

场景一：API 速率限制与防刷

这是令牌桶的主场。

想象你维护着一个公开的天气查询 API。恶意用户可能会编写脚本每秒发送 1000 次请求试图搞垮你的数据库。这时，我们可以为每个用户 ID 或 IP 配置一个令牌桶（容量: 20, 速率: 5个/秒）。

正常用户：点击几次页面，间隔较长，桶内令牌一直满的，请求永远畅通无阻。
脚本小子：瞬间发送 100 次请求。前 20 个请求消耗了积攒的令牌，立即成功。随后的请求由于令牌耗尽，直接返回 429 Too Many Requests。

优化建议：在 Redis 中实现分布式令牌桶。由于单机的内存无法在微服务架构中共享状态，利用 Redis 的原子操作（如 INLINECODEb5f75241 和 INLINECODE781476a9 结合 Lua 脚本）可以实现全局限流。

场景二：数据库连接池保护

这也是一个经典的漏桶应用场景。

数据库的连接数是有限的（比如只有 100 个）。业务请求的并发量可能高达每秒 10000。如果让所有请求直接打到数据库，数据库会瞬间崩溃。我们在应用层和数据库之间建立一个“漏桶”（其实就是连接池 + 异步队列）。

以恒定的速率（获取连接的速率）向数据库提交 SQL。
请求先进入应用层的内存队列。
如果队列满了（漏桶溢出），直接向用户返回“系统繁忙，请稍后再试”。

这种机制确保了数据库永远只处理它能承受的负载，多余的流量在进入数据库之前就被拦截了。

场景三：视频直播与带宽控制

在流媒体服务器向客户端推流时，我们需要保证数据包的传输尽可能平滑，避免网络出现大的浪涌。这里通常会结合使用这两种算法，但漏桶在流量整形方面更为基础。

视频编码产生的帧大小是不均匀的（I 帧很大，P 帧很小）。如果直接发送到网络，会造成瞬间带宽飙升。通过漏桶算法，我们可以将编码后的帧先放入缓冲区，然后以恒定的物理接口速率发送出去，保证网络链路的稳定利用。

—

总结与下一步

在这场关于流量管理的深度探索中，我们一起剖析了令牌桶与漏桶这两个系统设计中的基石。我们不仅学习了它们是如何工作的，更重要的是，我们学会了在灵活性与稳定性之间如何通过架构来做取舍。

如果你需要应对瞬间的流量高峰，同时保证长期的平均速率，令牌桶是你灵活的防守后卫。
如果你需要绝对的平滑输出，拒绝任何形式的流量抖动，漏桶则是你严谨的纪律委员。

在未来的系统设计中，当你面对流量洪峰时，希望你能自信地从工具箱中拿出正确的算法。下一步，我们建议你尝试在项目中使用 Redis 或 Nginx 内置的模块来配置这些算法，观察它们在真实网络环境下的表现。

感谢你阅读这篇文章，祝你的系统永远高可用，告别宕机！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入系统设计核心：令牌桶与漏桶算法的全方位实战指南

核心概览：我们将探讨什么？

什么是令牌桶算法？

它是如何工作的？

代码实战：实现一个简单的令牌桶

什么是漏桶算法？

它是如何工作的？

代码实战：基于队列的漏桶实现

令牌桶 vs 漏桶算法：核心差异与系统设计决策

深入思考：什么时候选择哪一个？

实战场景与最佳实践

场景一：API 速率限制与防刷

场景二：数据库连接池保护

场景三：视频直播与带宽控制

总结与下一步

相关文章美国1G带宽/1T流量高速vps $17.99/年