DAX 进阶之路：从 2026 年的视角重塑 Power BI 数据分析

2026-02-08 10:16:20 0条评论 38次阅读 0人点赞

在当今数据驱动的决策环境中，掌握 Microsoft Power BI 仅仅意味着你会拖拽字段，但真正的魔法始于你需要超越基础报表的时候。你是否曾经面临过这样的困境：现有的数据字段无法直接回答你的业务问题，或者你需要在报表中实现复杂的、动态的跨期计算？这时，数据分析表达式（Data Analysis Expressions，简称 DAX）就是那把开启高级分析大门的金钥匙。

在这篇文章中，我们将深入探讨 DAX 的核心概念，从基础语法到复杂的上下文转换，我们不仅会学习如何编写公式，更会像经验丰富的数据分析师一样思考，并结合 2026 年最新的 AI 辅助开发范式，通过实战案例构建出高效、健壮的数据模型。

1 什么是 DAX？
2 DAX 基础核心概念
3 2026 视野：高级 DAX 模式与工程化实践
4 2026 年开发趋势：AI 辅助的“氛围编程”
5 高级 DAX 函数与模式深度解析
6 企业级工程化：性能监控与可观测性
7 结语：持续进阶之路

什么是 DAX？

DAX 是一种功能强大的公式语言，专门为 Power BI、Power Pivot 和 SQL Server Analysis Services (SSAS) 的表格数据模型而设计。虽然它的语法看起来与 Excel 非常相似，但 DAX 在底层逻辑上有着本质的区别。

如果说 Excel 是处理单元格的语言，那么 DAX 就是处理“列”和“表”的语言。它让我们能够对数据模型执行高级计算，实现动态的、上下文感知的分析，这远超传统电子表格的范畴。通过 DAX，我们可以实现以下核心功能：

创建自定义度量值：动态计算销售总额、毛利率等 KPI。
构建计算列：在数据加载时派生新的数据维度。
处理复杂上下文：利用筛选上下文和行上下文进行精准的数据切片。
高级时间智能：轻松实现同比、环比、年初至今 (YTD) 等时间趋势分析。

DAX 基础核心概念

要真正掌握 DAX，仅仅知道函数名是不够的。我们需要理解其背后的两大核心支柱：度量值 与 计算列，以及它们如何与 上下文 相互作用。

1. 度量值 vs. 计算列

初学者最容易混淆的就是这两者的区别。让我们来拆解一下：

#### 度量值：动态计算的引擎

度量值是 DAX 的灵魂。它们是在查询时（即用户在报表中进行交互时）进行计算的，并且不存储在数据模型中。

动态响应：度量值会根据报表中的筛选器、切片器或坐标轴的变化而自动重新计算。
聚合为主：大多数度量值都涉及聚合运算，如 SUM、AVERAGE 或 COUNT。
内存优化：因为不存储物理数据，度量值通常比计算列更节省存储空间。

实战示例：计算总销售额。

// 计算销售表中的金额总和
Total Sales = SUM(Sales[Amount])

#### 计算列：物理存储的延伸

计算列是在数据刷新时计算的，其结果会物理存储在模型中，就像你从数据库中导入的普通列一样。

逐行计算：它基于当前行的数据计算出一个新值。
静态存储：一旦计算完成，值就固定了，不会因为报表的筛选而改变（除非数据刷新）。
适用场景：用于分类（如将年龄分段）、标记（如标记大额订单）或作为切片器使用。

实战示例：创建一个分类标记。

// 在销售表中，根据金额创建一个“订单等级”列
Order Category = 
IF(
    Sales[Amount] > 1000, 
    "Large", 
    "Small"
)

#### 如何选择？

这是一个常见的面试题，也是实战中的关键决策。如果你的计算结果需要随用户的交互而变化（例如“某地区的总销售额”），必须使用度量值。如果你需要根据行数据给每一行打上标签（例如“客户的年龄组”），或者需要在切片器中使用，则使用计算列。

2. 理解筛选上下文与行上下文

这是 DAX 最难也最强大的部分。

行上下文：简单理解为“当前正在处理的这一行”。在计算列中，公式会逐行迭代，这就是行上下文。迭代函数（如 SUMX, FILTER）也会创建行上下文。
筛选上下文：理解为你“当前看到的数据子集”。当你在 Power BI 中选择一个特定的年份或地区时，你就是在修改筛选上下文。DAX 的 CALCULATE 函数就是用来操纵筛选上下文的利器。

2026 视野：高级 DAX 模式与工程化实践

随着数据模型的复杂化，我们需要引入更高级的 DAX 模式来处理虚拟表计算，并应用现代软件工程的理念来管理我们的 DAX 代码。

1. 虚拟表与变量：让代码可读且高性能

在 2026 年的复杂业务逻辑中，直接在函数中嵌套多层逻辑已经不再被提倡。我们推崇使用 VAR（变量） 和 虚拟表（Virtual Tables） 来拆解逻辑。这不仅能提高代码的可读性，还能显著提升性能，因为 VertiPaq 引擎可以优化变量的计算。

实战案例：计算每个客户的排名

假设我们需要找出每个客户的销售额在所有客户中的排名（Top N 分析）。

// 2026 风格：使用变量和 RANKX 优化性能
Customer Rank = 
// 1. 先计算当前客户的总销售额，避免重复计算
VAR CurrentCustomerSales = [Total Sales]

// 2. 构建一个虚拟表，包含所有客户及其销售额
// 注意：ALLSELECTED 确保我们尊重外部切片器的选择，但忽略当前行的上下文
VAR AllCustomerSales = 
    ADDCOLUMNS(
        ALLSELECTED(Customer[Customer Name]),
        "Sales Amount", [Total Sales]
    )

// 3. 执行排名
RETURN
    RANKX(
        AllCustomerSales, 
        [Sales Amount], 
        CurrentCustomerSales
    )

深度解析：在这个例子中，我们没有简单地使用 INLINECODE057d03fc。我们显式地构建了一个包含所需数据的虚拟表变量 INLINECODE24190969。这种写法让 RANKX 的迭代更加透明，也更容易让 AI 辅助工具理解我们的意图，从而在代码审查时提出优化建议。

2. 处理多对多关系：桥梁表的高级应用

在现实世界的供应链或医疗数据模型中，我们经常遇到多对多关系。DAX 允许我们通过 INLINECODEa2da8ed7 或复杂的 INLINECODE25620fe8 来处理这些关系，而不必依赖物理连接。

实战案例：动态标签映射

假设我们有一个“促销标签”表，这些标签是动态分配给产品的，并且存储在 Excel 中而不是 SQL 关系数据库中。我们需要根据这些标签计算销售额。

// 动态虚拟关系计算
Sales with Dynamic Tags = 
CALCULATE(
    [Total Sales],
    // TREATAS 将一张表的列值映射到另一张表的列值，建立临时的虚拟关系
    TREATAS(
        VALUES(‘Dynamic Tags‘[ProductName]),
        ‘Product‘[Product Name]
    )
)

2026 年开发趋势：AI 辅助的“氛围编程”

在我们最近的几个大型企业级 Power BI 项目中，我们注意到开发模式正在发生根本性的转变。现在的我们，不再仅仅是在写代码，而是在与 AI 进行结对编程。这就是我们所说的“Vibe Coding”——一种让自然语言意图直接转化为高效 DAX 代码的工作流。

利用 Agentic AI 编写复杂的 DAX

以前，为了编写一个计算“移动平均”或“动态库存”的复杂度量值，我们可能需要查阅大量的文档。现在，我们可以使用像 Cursor 或 GitHub Copilot 这样的 AI 工具来直接生成初稿。

场景：我们需要计算每个产品类别的“累计至今总和”，但只在销售额超过特定阈值时才计算。
AI 辅助提示词策略：

我们可以这样问 AI：“请编写一个 DAX 度量值，计算按‘Product Category’分组的‘Sales Amount’累计总和，但仅当当前上下文中的‘Total Sales’大于 10000 时才显示结果，否则返回 BLANK()。”

AI 生成的代码原型：

// AI 辅助生成的代码：带有条件的累计求和
Cumulative Sales Conditional = 
IF(
    [Total Sales] > 10000,
    CALCULATE(
        [Total Sales],
        FILTER(
            ALLSELECTED(‘Sales‘),
            ‘Sales‘[Order Date] <= MAX('Sales'[Order Date])
        )
    ),
    BLANK()
)

我们的审查与优化：

虽然 AI 给出了逻辑框架，但作为经验丰富的开发者，我们必须注意性能。INLINECODEd680a68f 在大数据量下可能会导致性能瓶颈。我们会建议使用带有 INLINECODE53243c15 或 OFFSET 函数的虚拟表来优化，这是 2026 年 DAX 开发的标准优化思路。

LLM 驱动的调试与文档化

你是否曾面对一段六个月前写的、充满了 CALCULATE 嵌套的代码而一头雾水？现在，我们可以将这段代码直接投喂给 LLM（大语言模型），并要求它：“请解释这段 DAX 代码的上下文转换流程，并生成文档注释。”

这不仅能帮助我们快速理解旧代码，还能确保我们的代码库对于新团队成员来说是可读的。通过 AI 的 Code Analysis 功能，它能识别出潜在的上下文冲突，比如某个筛选器被意外覆盖了。

高级 DAX 函数与模式深度解析

现在，让我们通过具体的函数类别来看看如何将理论转化为实践。我们将结合代码示例深入讲解。

1. 时间智能：穿越数据的时光机

商业分析中最常见的需求就是“与去年同期相比”。DAX 内置了强大的时间智能函数，但这通常要求你的模型中必须有一个标记为“日期表”的连续日期表。

实战案例：计算同比销售额

假设我们需要计算今年的总销售额，并与去年进行对比。

// 1. 计算去年的总销售额
// SAMEPERIODLASTYEAR 返回当前上下文所选日期在上一年的对应日期集合
Sales Last Year = 
CALCULATE(
    [Total Sales], 
    SAMEPERIODLASTYEAR(‘Date‘[Date])
)

// 2. 计算同比增长率
// 我们定义一个度量值来计算百分比变化
YoY Growth % = 
DIVIDE(
    [Total Sales] - [Sales Last Year], 
    [Sales Last Year]
)

代码解析：在这里，INLINECODEb1dbff44 是最重要的函数。它不仅改变了计算逻辑，还利用 INLINECODE25cf6cff 修改了筛选上下文。当你在报表中选择了“2023年”，这个函数会悄悄把筛选上下文切换到“2022年”，从而计算出正确的分母。

2. 筛选与聚合：CALCULATE 与 FILTER 的艺术

INLINECODEdf7a2201 是 DAX 中唯一能够改变筛选上下文的函数。配合 INLINECODEde329e6d，我们可以实现极其复杂的业务逻辑。

实战案例：计算特定颜色产品的销售额

假设我们只想计算“红色”产品的销售额，但不想在切片器中手动筛选。

// 计算 Red 产品的总销售额
// CALCULATE 的第一个参数是计算表达式，后续参数是筛选条件
Red Product Sales = 
CALCULATE(
    [Total Sales], 
    ‘Product‘[Color] = "Red"
)

// 更复杂的场景：计算单价大于平均值的产品销售额
// 这里我们使用了 FILTER 函数来遍历表，创建一个临时的虚拟表
High Value Products Sales = 
CALCULATE(
    [Total Sales], 
    FILTER(
        ‘Product‘, 
        ‘Product‘[Unit Price] > AVERAGE(‘Product‘[Unit Price])
    )
)

深度解析：在第二个例子中，INLINECODE3539660e 函数创建了一个行上下文来遍历产品表，但 INLINECODEe49c5c2e 将这个行上下文转换成了筛选上下文。这种“上下文转换”是 DAX 进阶的必经之路。

3. 聚合函数：不仅仅是求和

除了基础的 SUM 和 COUNT，DAX 还提供了迭代函数，以 X 结尾，如 SUMX, MINX, AVERAGEX。

实战案例：计算复杂的加权平均或税后总价

如果我们想在模型中没有“税”列的情况下，直接计算税后销售额。

// SUMX 逐行计算表达式，然后求和
// 参数1: 要迭代表，参数2: 每一行的计算表达式
Total Sales Plus Tax = 
SUMX(
    Sales, 
    Sales[Amount] * (1 + Sales[Tax Rate])
)

4. 逻辑函数：控制业务流程

IF, AND, OR, SWITCH 是处理业务逻辑的基石。

实战案例：客户分类评级

我们可以使用 SWITCH 来替代多层嵌套的 IF，使代码更易读。

// 根据客户的购买总额进行星级评定
Customer Rating = 
SWITCH(
    TRUE(), // TRUE() 允许我们进行逻辑判断
    [Total Sales] < 1000, "Bronze",
    [Total Sales] = 5000, "Gold",
    "Unknown" // 默认值
)

企业级工程化：性能监控与可观测性

在 2026 年，构建一个 Power BI 报表不仅仅是让它“跑通”，更关乎其在生产环境中的可维护性和性能。我们引入了现代软件工程中的“可观测性”理念。

性能剖析与 DAX 查询计划

当报表加载超过 3 秒时，用户体验就会急剧下降。我们不再仅仅依赖感觉，而是使用 VertiPaq Analyzer 或 Power BI Performance Analyzer 来深入挖掘。

实战案例：优化一个缓慢的度量值

假设我们有一个计算“客户复购率”的度量值，它跑得非常慢。

未优化的代码：

// 性能较差：使用了大量的迭代器嵌套
Repurchase Rate Bad = 
COUNTROWS(
    FILTER(
        CUSTOMER,
        COUNTROWS(FILTER(Sales, Sales[CustomerKey] = CUSTOMER[CustomerKey])) > 1
    )
)

优化策略：

我们注意到这里使用了行级安全性的迭代逻辑，这在百万行数据下是灾难。我们可以利用变量和物理关系来重构。

优化后的代码：

// 性能优化版：利用聚合和关系
Repurchase Rate Good = 
VAR TotalCustomers = 
    COUNTROWS(VALUES(Customer[CustomerKey]))

VAR RepeatCustomers = 
    CALCULATE(
        COUNTROWS(VALUES(Customer[CustomerKey])),
        ‘Sales‘[Count of Orders] > 1 // 假设我们在模型中预聚合了这个计数
    )

RETURN
    DIVIDE(RepeatCustomers, TotalCustomers)

边界情况与容灾处理

在 2026 年的数据生态中，数据源往往是不稳定的。实时流数据可能会导致除零错误或空值引用。

最佳实践：我们在所有除法运算中强制使用 DIVIDE 函数，并在关键度量值中加入错误处理逻辑。

// 健壮的 KPI 定义
Safe KPI = 
VAR Result = 
    DIVIDE(
        [Total Revenue], 
        [Total Transactions],
        0 // 替代错误值，防止报表崩溃
    )
RETURN
    IF(ISBLANK(Result), 0, Result)

技术债务管理

随着时间推移，模型中会积累大量“为了快速修复”而生成的计算列。这些是技术债务。我们建议定期进行模型重构审查，将不再依赖切片器的计算列回滚为度量值，以减少模型大小并提高加载速度。

结语：持续进阶之路

DAX 不仅仅是一门语言，更是一种思维方式。从今天的学习中，我们可以看到，通过掌握度量值、计算列以及筛选上下文的运作机制，并融合 2026 年的 AI 辅助开发工具，我们能够构建出极具洞察力的商业智能模型。

我们正处于一个令人兴奋的时代，AI 帮我们处理了繁琐的语法记忆，让我们可以更专注于业务逻辑和数据建模的艺术。但请记住，精通 DAX 没有捷径。我建议你从以下几个步骤开始你的进阶之旅：

动手实践：不要只看代码。打开 Power BI Desktop，结合 Copilot 尝试复刻文章中的示例，并尝试修改它们，观察 AI 的建议。
阅读他人的代码：在社区（如微软 Power BI 社区）浏览复杂的度量值模式，理解其中的变量逻辑和上下文转换。
关注数据模型：DAX 的表现取决于底层模型的结构。一个规范的星型模型能让你的 DAX 写起来事半功倍，也能让 AI 更好地理解你的意图。

数据分析是一场发现之旅，而 DAX 就是你手中最锋利的地图。让我们一起用它去挖掘数据背后隐藏的价值吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客