数据建模是识别、组织和定义企业收集的数据类型及其之间关系的过程。它利用图表、符号和文本定义,直观地展示了数据是如何被捕获、存储和使用的。一个设计良好的数据模型能帮助我们:
- 理解数据需求
- 确保用于报表的合理结构
- 与业务目标保持一致
- 维护数据完整性
Power BI 界面与数据加载
1. Power BI 工作区
Power BI 工作区是一个中心文件夹,用于存储所有数据集、报表、仪表板和工作簿。当我们打开 Microsoft Power BI Desktop 时,首先看到的就是这个界面。
!dm1111工作区
2. Power BI Desktop 窗格
Power BI Desktop 主要包含三个窗格:报表、可视化效果和数据。报表窗格显示使用“数据”窗格中的字段创建的视觉对象,而“可视化效果”窗格则允许我们选择和自定义图表类型。
!openPowerBI Desktop 窗格
3. 数据窗格概览
加载了 Excel 文件等数据源后,右侧的“数据”窗格将显示可用于报表和分析的表和字段。
!datafieldsPane数据窗格
4. 连接到数据源
Power BI 允许我们从单个或多个数据源提取数据。支持的数据源包括 Excel、CSV/文本、XML、JSON、Oracle 数据库、Azure SQL 数据库、基于云的服务等。
!GetDataSources数据源
5. 选择数据源类型
我们可以根据可用性和业务需求(例如 Excel 文件、CSV 文件、数据库或在线云源)选择所需的数据源。
!getDataExcel选择数据源类型
6. 数据加载与转换
选择数据源后,“导航器”窗口可以帮助我们预览、转换数据并将其加载到 Power BI 中,以便进行进一步的建模和分析。
理解数据建模中的关系
关系是数据建模的主要功能,它定义了所有的数据类型。关系帮助我们使用基数与多个数据源建立连接。下图显示了我们拥有用于数据、属性、可视化效果和报表的不同窗格。
!udmPower BI 中的视图
我们可以在多个数据源上进行数据可视化,方法是通过分析数据并定义它们之间的关系。
!visualizationsPane可视化和数据窗格
我们还可以定义数据类型,解释数据用途,管理数据,确定数据需求,删除冗余数据(数据完整性),检索数据并执行数据分析,跟踪关键绩效指标,为业务提供有用的解决方案。
Power BI 中的数据视图
- Power BI Desktop 中的数据视图显示所选数据源(例如 Excel 文件)的内容。此视图允许我们探索表、列和单个记录,在创建关系或报表之前提供对数据集的清晰理解。
!DataView数据视图
- 在模型中定义数据属性之间的关系可以让我们获得更深入的洞察,并支持有效的数据叙事,从而允许访问来自多个源的相关数据
!resize-16901349221372777454Screenshot8Power BI 中的数据关系
Power BI 中的模型视图
模型视图显示表、它们的属性以及它们之间的关系,这对于准确生成报表至关重要。下图显示所选数据集的模型视图。
!ModelView模型视图
Power BI 中的报表视图
报表视图允许我们创建包含筛选器、向下钻取和跨报表交互等详细功能的报表。我们可以根据需求选择多个参数进行分析,从而实现自定义的交互式数据探索。
!ReportViewPane报表视图
- *