Power Bi 简明教程

Power BI - Data Modeling

在本章,您将了解 Power BI 中的数据建模。

Using Data Modeling and Navigation

数据建模是 BI 工具中利用关系来连接多个数据源的一项功能。关系定义了数据源如何彼此连接,您可以在多个数据源之上创建有趣的数据可视化。

利用建模功能,您可以在现有表中构建自定义计算,而这些列可直接显示到 Power BI 可视化中。这使得业务能够定义新的度量并针对这些度量执行自定义计算。

modeling feature

在上面的图片中,您能看到一个通用的数据模型,其显示了两个表之间的关系。这两个表利用列名“Id”进行连接。

类似地,在 Power BI 中,您可以设置两个对象之间的关系。要设置关系,您必须在常见的列之间拖拽一条线。您还可以在 Power BI 中的数据模型中查看“关系”。

要在 Power BI 中创建数据模型,您需要将所有数据源添加到 Power BI 新报告选项中。要添加数据源,请转到“获取数据”选项。然后,选择您想要连接的数据源并单击“连接”按钮。

data model in power bi

一旦添加了数据源,它将显示在右侧边栏中。在以下图片中,我们使用 2 个 xls 文件来导入数据 - 客户和产品。

add data source

在 Power BI 的屏幕左侧,您有以下三个选项卡 −

  1. Report

  2. Data

  3. Relationships

power bi screen

当您导航到“报告”选项卡时,您可以看到为数据可视化选择的一个仪表板和图表。您可以根据需要选择不同类型的图表。在我们的示例中,我们从可用可视化中选择了“表”类型。

report tab

当您转到“数据”选项卡时,您可以看到来自数据源的所有数据,这些数据符合已定义的关系。

data tab

在“关系”选项卡中,您可以看到数据源之间的关系。当您将多个数据源添加到 Power BI 可视化时,该工具会自动试图检测列之间的关系。当您导航到“关系”选项卡时,您可以查看关系。您还可以使用“创建关系”选项在列之间创建一个关系。

relationship tab

您还可以在数据可视化中添加和移除关系。要移除关系,您必须右键单击并选择“删除”选项。要创建一个新的“关系”,您只需拖放您想要在数据源之间链接的字段即可。

relationships

您还可以使用关系视图在报表中隐藏特定列。要隐藏某一列,请右键单击该列名称,并选择“在报表视图中隐藏”选项。

relationship view

Creating Calculated Columns

可以通过结合现有数据中的两个或更多元素在 Power BI 中创建计算列。您还可以对现有列应用计算,以定义新指标或结合两列来创建一列新列。

您甚至可以创建计算列来建立表之间的关系,而且还可以使用它来设置两个表之间的关系。

要创建新的计算列,请导航到屏幕左侧的数据视图选项卡,然后单击建模。

new calculated column

当您导航到建模选项卡时,您可以在屏幕顶部看到一个新建列选项。这样也会打开公式栏,您可以在其中输入 DAX 公式以执行计算。DAX(数据分析表达式)是一种强大的语言,也用于 Excel 中执行计算。您还可以通过更改公式栏中的列文本重新命名该列。

modeling tab

在以下示例中,让我们创建一个新列:产品代码 (Product_C),它是从 Prod_Id 列的最后三个字符派生的。然后,写入以下公式 −

Product_C = RIGHT( Sheet1[Prod_Id],3)
create new column

还提供了很多公式,您可以使用它们来创建计算列。您必须输入用作计算的公式的第一个字符,如下面的屏幕截图所示。

creating calculated columns

Creating Calculated Tables

您还可以创建 Power BI 中的数据建模中的新计算表。要创建新表,请导航到屏幕左侧的数据视图选项卡,然后转到屏幕顶部的建模选项。

modeling option

DAX 表达式用于创建新表。您必须在等号的左侧输入新表的名称和 DAX 公式以执行计算以在右侧形成该表。当计算完成后,新表会出现在您模型的“字段”窗格中。

在以下示例中,让我们定义新表 - Table_CustC,它返回包含另一个表中一列中的唯一值的单列表。

table custc

如以下屏幕截图所示,新表会添加到 Power BI 屏幕中的“字段”部分下。一旦根据您的要求创建计算列和计算表,您就可以在 Power BI 的“报表”选项卡中使用字段。

要添加这些对象,您必须选择一个复选框,并且若可能,系统会自动检测到关系。如果不是,那么您可以拖动您要连接的列。

select checkbox

要查看报表,请导航到报表选项卡,在报表视图中,您既可以查看“计算列”,还可以查看新“计算表”中的字段。

calculated columns

Managing Time-Based Data

Power BI 默认允许深入钻取基于时间的数​​据。当您在分析中添加日期字段并在数据可视化中启用深入钻取后,它会带您深入了解下一层基于时间的数​​据。

让我们考虑我们在 Power BI 可视化中添加了基于时间的表。我们在报表中添加了收入和年份列。

revenue column
year column

我们可以使用顶部的选项在可视化中启用深入钻取功能。一旦我们启用深入钻取功能,并单击图表中的条形图或折线图,它就会深入钻取到时间层级的下一层。 Example: 年份 → 季度 → 月份。

我们还可以在层级中使用转到下一层选项来执行深入钻取。

hierarchy option