如何在 Python-Plotly 中创建堆叠柱状图？—— 2026年全栈开发者指南

2026-02-13 14:58:43 0条评论 90次阅读 0人点赞

在数据可视化的世界里，我们经常要面对这样的挑战：不仅要展示数据的总量，还要清晰地剖析总量背后的构成。这时候，普通的柱状图往往显得力不从心。今天，我们将深入探讨一种非常实用的图表类型——堆叠柱状图。

无论你是正在进行金融数据分析，还是处理复杂的销售报表，掌握堆叠柱状图的绘制技巧都将是你武器库中的重要一环。在这篇文章中，我们将摒弃枯燥的理论堆砌，通过实际代码示例，带你一步步掌握从基础到高级的各种用法。我们将结合 2026 年最新的开发理念，从“代码即文档”到“AI 辅助编程”，全方位展示如何高效构建可视化解决方案。

为什么在 2026 年依然选择 Plotly？

在开始编码之前，我想简单聊聊为什么在 2026 年，Plotly 依然是我们进行 Web 交互式可视化的首选。随着 BI 工具的普及，虽然有很多拖拽式解决方案，但 Plotly 提供了不可替代的编程灵活性和深度集成能力。它允许我们创建不仅能看，还能“玩”的图表。你可以缩放、悬停查看详细数据、甚至通过回调函数切换显示的维度。对于堆叠柱状图而言，这种交互性至关重要，因为它允许我们在有限的屏幕空间内展示多维度的信息，同时保持图表的整洁性。

Plotly 主要提供了两个接口：Plotly Express (px) 和 Graph Objects (go)。

Plotly Express：它是高级封装，语法简洁，符合“Vibe Coding（氛围编程）”的理念，几行代码就能搞定绝大多数需求，非常适合快速探索数据。
Graph Objects：它是底层 API，提供了对图表每一个像素级别的控制权，适合需要高度定制化的复杂场景。

我们将通过一系列示例，展示这两种方式的威力，并穿插现代开发流程中的最佳实践。

示例 1：快速上手——探索 Iris 数据集

让我们从一个经典的生物学案例入手。Iris（鸢尾花）数据集是机器学习领域的“Hello World”，但它也非常适合用来演示堆叠柱状图。假设我们想要比较不同种类鸢尾花的萼片长度（Sepal Length）和宽度（Sepal Width），同时还能看到数据点的分布情况。

虽然这是一个散点图通常展示的数据，但我们可以通过将其转换为条形图的形式，利用 color 参数自动生成堆叠效果。这展示了 Plotly 的智能化：只要你指定了颜色映射，它会自动处理分组的逻辑。

# 导入 Plotly Express 模块
import plotly.express as px

# 加载内置的 Iris 数据集
df = px.data.iris()

# x轴：萼片宽度
# y轴：萼片长度（此处作为堆叠的数值依据）
# color：按花的种类分类，不同的种类会自动堆叠在一起
# hover_data：鼠标悬停时显示额外信息（花瓣宽度）
fig = px.bar(df, 
             x="sepal_width", 
             y="sepal_length", 
             color="species",
             hover_data=[‘petal_width‘], 
             barmode=‘stack‘,
             title="Iris 数据集：按种类堆叠的萼片尺寸分析",
             labels={"sepal_width": "萼片宽度", "sepal_length": "萼片长度"})

# 显示图表
fig.show()

#### 代码深度解析：

在这个例子中，INLINECODEaceab1d5 是核心参数。它告诉 Plotly 将同一 X 轴位置的不同柱体（由 INLINECODE53385968 划分）垂直堆叠起来。如果没有这个参数，它们会并排显示。这种视图让我们能直观地看到：对于特定的萼片宽度，不同种类的花的贡献是多少。

示例 2：实战场景——餐厅消费数据分析

接下来的例子更贴近商业分析。我们将使用 Tips（小费）数据集。在餐饮业分析中，我们经常想知道：每天的总收入是多少？这些收入中，男性顾客和女性顾客的贡献比例如何？

这时候，堆叠柱状图就派上用场了。我们可以把“天”作为 X 轴，把“总账单金额”作为 Y 轴，并用“性别”作为颜色分类堆叠。

import plotly.express as px

# 加载 Tips 数据集
df = px.data.tips()

# 创建图表
fig = px.bar(df, 
             x="day",            # X 轴：星期几
             y="total_bill",      # Y 轴：总账单金额
             color="sex",         # 颜色：按性别分类堆叠
             barmode=‘stack‘,      # 模式：堆叠
             title="餐厅账单分析：按性别堆叠的每日消费总额",
             category_orders={"day": ["Thur", "Fri", "Sat", "Sun"]}, # 自定义排序
             labels={"total_bill": "总消费金额 ($)", "day": "星期"})

fig.show()

#### 实用见解：

请注意代码中的 category_orders。默认情况下，Plotly 可能会按字母顺序排列星期（Fri, Sat, Sun, Thur），这不符合我们的时间直觉。我们通过这个参数强制按实际星期顺序排列，这是一个让图表显得更专业的细节。

示例 3：生产级代码——使用 Graph Objects 实现企业级定制

在现代企业级开发中，我们经常需要精确控制 UI 细节以符合品牌规范，或者需要处理动态更新的数据流。这时候，INLINECODEe798068e（常简称为 INLINECODEc3e07136）就是我们的不二之选。

在这个例子中，我们将手动构建数据。这种方法虽然代码稍多，但它给了我们完全的控制权，允许我们混合不同来源的数据，并且更易于集成到大型后端服务中。

import plotly.graph_objects as go
import numpy as np

# 设置随机种子，保证结果可复现
np.random.seed(42)

# 定义 X 轴的类别
x = [‘A 项目‘, ‘B 项目‘, ‘C 项目‘, ‘D 项目‘]

# 模拟两组数据（比如 2023年 和 2024年 的业绩）
data_2023 = [100, 200, 500, 673]
data_2024 = [56, 123, 982, 213]

# 创建 Figure 对象
# 这里我们手动定义了每一个 Bar（柱子）
fig = go.Figure(data=[
    go.Bar(
        name=‘2023年业绩‘,
        x=x,
        y=data_2023,
        marker_color=‘indigo‘, # 手动指定颜色，符合企业品牌色
        text=data_2023,        # 添加数据标签
        textposition=‘inside‘  # 标签位置
    ),
    go.Bar(
        name=‘2024年业绩‘,
        x=x,
        y=data_2024,
        marker_color=‘lightsalmon‘,
        text=data_2024,
        textposition=‘inside‘
    )
])

# 关键步骤：设置布局为堆叠模式，并添加更丰富的交互配置
fig.update_layout(
    barmode=‘stack‘,
    title=‘项目业绩对比（两年份堆叠）‘,
    xaxis_title=‘项目名称‘,
    yaxis_title=‘业绩数值‘,
    legend_title="年份",
    hovermode=‘x unified‘, # 现代交互风格：悬停时统一显示 X 轴所有数据
    font=dict(
        family="Courier New, monospace", # 统一字体风格
        size=12,
        color="RebeccaPurple"
    )
)

fig.show()

#### 这种方式的妙处：

使用 INLINECODE6501132b 对象时，我们可以针对每一个 INLINECODEcfb7c152 实例单独设置样式（比如不同的 marker_color），这在需要特定品牌配色的图表中非常有用。此外，这种结构化对象的方式，更符合我们在 2026 年使用 Agentic AI（代理式 AI）生成代码的习惯——因为它结构清晰，便于 AI 理解和修改。

示例 4：处理负值与复杂财务场景（含容错处理）

在现实世界的数据分析中，我们不仅要面对正值，还要处理负值（比如亏损与盈利）。堆叠柱状图处理负值的方式非常优雅，它会自动以 0 轴为基准向下延伸。

让我们创建一个包含正负值的示例，展示公司的财务状况。同时，我会演示如何处理常见的脏数据问题，这是新手最容易踩坑的地方。

import plotly.express as px
import pandas as pd
import numpy as np

# 模拟财务数据
months = [‘1月‘, ‘2月‘, ‘3月‘, ‘4月‘, ‘5月‘]
revenue = [100, 120, 90, 150, 130]    # 营收（正）
expense = [80, 110, 95, 100, 140]     # 支出（正）
net_income = [20, 10, -5, 50, -10]   # 净收入（可能为负）

df = pd.DataFrame({
    "月份": months,
    "营收": revenue,
    "支出": expense,
    "净收入": net_income
})

# 为了演示堆叠，我们转换数据格式为“长格式”
# 这是 Plotly Express 处理多维数据的最佳实践
df_melted = df.melt(id_vars="月份", var_name="财务指标", value_name="金额")

# 绘制图表
fig = px.bar(df_melted, 
             x="月份", 
             y="金额", 
             color="财务指标", 
             title="公司月度财务收支堆叠图",
             text="金额") # 在柱子上显示数值

# 性能优化与展示优化：当数据量过大时，不要显示所有 text，以免浏览器渲染卡顿
# 这里仅作演示，我们对数值进行格式化
fig.update_traces(
    texttemplate=‘%{text:.2s}‘, # 科学计数法简化显示
    textposition=‘inside‘
)

fig.update_layout(
    barmode=‘stack‘, 
    xaxis={‘categoryorder‘:‘array‘, ‘categoryarray‘:months},
    uniformtext_minsize=8, # 最小字体大小
    uniformtext_mode=‘hide‘ # 如果空间太小，自动隐藏文字
)

fig.show()

2026 开发进阶：AI 辅助与工程化最佳实践

我们正处在一个“Vibe Coding”（氛围编程）的时代。作为开发者，我们需要思考如何将这些可视化代码集成到更复杂的系统中。

#### 1. 数据长宽格式转换与自动化

你可能会遇到这样的情况：你的数据是从 SQL 数据库直接取出的 Pivot Table（透视表，宽格式），而 Plotly Express 更喜欢 Long Format（长格式）。如果你发现 px.bar 无法正确堆叠，最常见的原因就是数据格式问题。

现代解决方案： 不要手动写 pd.melt()。在使用 Cursor 或 Windsurf 等 AI IDE 时，你可以直接选中数据变量，然后通过自然语言提示 AI：“将这个 DataFrame 转换为 Plotly 需要的长格式”。AI 通常会为你生成正确的 ETL（抽取、转换、加载）代码。这不仅提高了效率，还减少了硬编码带来的维护债务。

#### 2. 性能优化与可观测性

当数据量非常大（例如超过 50,000 个数据点）时，Plotly 的交互可能会变慢，这是由于前端 WebGL 渲染压力造成的。

我们的优化策略：

聚合先行：不要把海量的原始数据直接丢给前端。在 Python 后端使用 pandas.groupby() 进行预聚合。
WebGL 加速：对于超大规模散点或线图，使用 INLINECODE90ea7156 或类似的 WebGL 变体。对于堆叠柱状图，如果类别过多，考虑使用 INLINECODE0fdd4417 进行降采样，或者只在初始渲染时显示概览，点击后再通过 Callback 加载详情（这属于 Dash 开发范畴，但理念相通）。

#### 3. 常见陷阱与容灾设计

在我们最近的一个项目中，遇到了一个棘手的问题：缺失值。

如果你的数据中包含 NaN（空值），Plotly 在堆叠时可能会出现断裂或者计算错误的总高度。

最佳实践：

# 在绘图前清洗数据
df_clean = df.fillna(0) # 或者根据业务逻辑填充平均值

此外，视觉清晰度也是一个大坑。当堆叠的类别太多（超过 5 个）时，图表会变得难以阅读。如果必须展示很多类别，考虑使用“归一化堆叠”（百分比堆叠）。你可以通过在 INLINECODEaafc9794 中设置 INLINECODEb42dce51 来控制显示的优先级，或者提供交互式的图例筛选功能，让用户自己决定查看哪些维度。

总结

通过这篇文章，我们不仅学习了如何在 Plotly 中使用 barmode=‘stack‘，更重要的是，我们掌握了处理多维数据比较的思维方式。从快速原型开发到高度定制的商业图表，Plotly 提供了完整的解决方案。

在 2026 年，技术不仅仅是关于写出代码，更是关于如何利用 AI 工具加速这一过程，以及如何构建可维护、高性能的系统。我鼓励你尝试修改上面的代码，使用你自己的数据集。你会发现，通过调整颜色、悬停信息和布局，你可以将枯燥的数据转化为引人入胜的故事。祝你编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客