Tableau 简明教程
Tableau - Overview
Tableau 作为领先的数据可视化工具,拥有许多令人向往和独一无二的功能。其强大的数据发现和浏览应用程序让您可以在几秒钟内回答重要问题。您可以使用 Tableau 的拖放界面来可视化任何数据、浏览不同的视图,甚至轻松地组合多个数据库。它不需要任何复杂的脚本。任何了解业务问题的人都可以通过相关数据的可视化效果来解决问题。分析之后,只需发布到 Tableau Server 即可轻松与他人分享。
Tableau Features
Tableau 为各种行业、部门和数据环境提供解决方案。以下是让 Tableau 能够处理各种场景的一些独一无二的功能。
-
Speed of Analysis − 因为它不需要很高的编程专业知识,任何有权访问数据的用户都可以开始使用它从数据中获取价值。
-
Self-Reliant − Tableau 不需要复杂的软件设置。大多数用户使用的桌面版安装简单,包含开始和完成数据分析所需的所有功能。
-
Visual Discovery − 用户使用颜色、趋势线、图表和图形等可视化工具浏览和分析数据。几乎一切都通过拖放操作完成,因此很少有脚本需要编写。
-
Blend Diverse Data Sets − Tableau 让您可以在无前期高昂集成成本的情况下实时混合不同的关系型、半结构化和原始数据源。用户无需了解数据的存储细节。
-
Architecture Agnostic − Tableau 可以在数据流动的各种设备上工作。因此,用户无需担心使用 Tableau 时特定的硬件或软件要求。
-
Real-Time Collaboration − Tableau 可以即时过滤、排序和讨论数据,并在 SharePoint 站点或 Salesforce 之类的门户中嵌入一个动态仪表板。您可以保存您看到的数据,并允许同事订阅您的互动式仪表板,以便他们只需刷新网络浏览器就能看到最新数据。
-
Centralized Data − Tableau Server 提供了一个集中式位置来管理组织发布的所有数据源。您可以在一个方便的位置删除、更改权限、添加标签和管理日程。在数据服务器中安排刷新提取并对其进行管理非常容易。管理员可以在服务器上集中定义提取日程,用于增量刷新和完全刷新。
Tableau - Environment Setup
在本章节中,您将了解 Tableau 的环境设置。
Download Tableau Desktop
Tableau Desktop 的免费个人版可从 Tableau Desktop. 下载。您需要使用您的详细资料进行注册才能下载。
下载后,安装过程非常简单,您需要接受许可协议并提供安装目标文件夹。以下步骤和屏幕截图描述了整个安装过程。
Tableau - Get Started
在本章中,你将学习 Tableau 中的一些基本操作以熟悉其界面。创建任何 Tableau 数据分析报表涉及三个基本步骤。
这三个步骤分别是−
-
Connect to a data source −它涉及查找数据并使用适当的连接类型来读出数据。
-
Choose dimensions and measures −它涉及从源数据中选择要用于分析的列。
-
Apply visualization technique −它涉及将所需的显示方法(如图形或图表类型)应用于正在分析的数据。
为方便起见,我们使用 Tableau 安装附带的示例数据集,名为 sample - superstore.xls。找到 Tableau 的安装文件夹并转至 My Tableau Repository 。在其下面,你在 Datasources\9.2\en_US-US 处将找到上述文件。
Connect to a Data Source
在打开 Tableau 时,你将获得显示各种数据源的启动页。在标题 “Connect” 下,你可以选择文件、服务器或已保存的数据源。在“文件”下,选择 excel。然后导航到如上所述的文件 “Sample – Superstore.xls” 。excel 文件中有三个工作表,名为“订单”、“人员”和“退货”。选择 Orders 。
Tableau - Navigation
在本章中,您将熟悉 Tableau 界面提供的各种导航功能。在运行 Tableau 桌面时,您将获得显示我们可以导航的所有命令的顶部菜单。让我们打开一个空白工作簿,并逐一了解每个菜单下的各种重要功能。
Menu Commands
单击"获取开始"窗口时,您将获得包含所有可用菜单命令的主界面。它们代表 Tableau 中可用的整个功能集。以下图片中显示了菜单的各个部分。接下来,您还可以看到每个菜单的一些详细信息。
File Menu
此菜单用于创建一个新的 Tableau 工作簿,并从本地系统和 Tableau 服务器中打开现有的工作簿。此菜单中的重要功能包括:
-
Workbook Locale 设置要在报表中使用的语言。
-
Paste Sheets 将工作表粘贴到剪贴板中,该工作表是从另一个工作簿中复制的。
-
Export Packaged Workbook 选项用于创建将与其他用户共享的打包工作簿。
Data Menu
此菜单用于创建新的数据源以为分析和可视化获取数据。它还允许您替换或升级现有的数据源。
此菜单中的重要功能包括:
-
New Data Source 允许查看所有可用的连接类型并从中选择。
-
Refresh All Extracts 从源刷新数据。
-
Edit Relationships 选项定义用于链接多个数据源中的字段。
Worksheet Menu
此菜单用于创建新的工作表,包含各种显示功能,如显示标题、标题等。
此菜单中的重要功能包括:
-
Show Summary 允许查看工作表中使用的数据摘要,如计数等。
-
鼠标悬停在各种数据字段上方时,工具提示将显示工具提示。
-
Run Update 选项更新工作表数据或已使用的筛选器。
Dashboard Menu
此菜单用于创建新的仪表盘,包含各种显示功能,如显示标题、导出图像等。
此菜单中的重要功能包括:
-
Format 设置仪表板的布局(色彩和部分)。
-
Actions 将仪表板 sheet 链接到外部 URL 或其他 sheet。
-
Export Image 选项导出仪表板图像。
Story Menu
此菜单用于创建新的 story,该 story 具有许多具有关联数据 sheet 或仪表板。
此菜单中的重要功能包括:
-
Format 设置 story 的布局(色彩和部分)。
-
Run Update 使用来自数据源的最新数据更新 story。
-
Export Image 选项导出 story 图像。
Analysis Menu
此菜单用于分析 sheet 中显示的数据。Tableau 提供许多开箱即用的功能,例如计算百分比和执行预测等。
此菜单中的重要功能包括:
-
Forecast 显示基于可用数据的预测。
-
Trend Lines 显示一系列数据的趋势线。
-
Create Calculated Field 选项在现有字段上基于特定计算创建其他字段。
Map Menu
此菜单用于在 Tableau 中构建地图视图。您可以为数据中的字段分配地理角色。
此菜单中的重要功能包括:
-
Map Layers 隐藏和显示地图层,例如街道名称、国家边框以及添加数据层。
-
Geocoding 创建新的地理角色,并将其分配给数据中的地理字段。
Tableau - Design Flow
由于 Tableau 有助于分析大量数据(跨越不同的时间段、维度和度量),因此需要非常精心的规划才能创建良好的仪表板或故事。因此,了解设计良好仪表板的方法非常重要。与人类努力的任何其他领域一样,要创建良好工作表和仪表板,需要遵循许多最佳实践。
虽然 Tableau 项目的最终预期结果理想情况下是带有故事的仪表板,但在达成此目标之前有许多中间步骤需要完成。以下是设计步骤的流程图,应理想地遵循该流程图以创建有效的仪表板。
Connect to Data Source
Tableau 可连接到所有流行的数据源。它具有内置连接器,可在提供连接参数后负责建立连接。无论它是什么,是简单的文本文件、关系源、SQL 源还是云数据库,Tableau 几乎可连接到所有数据源。
Tableau - File Types
Tableau 中的数据分析结果可以保存为各种格式,以便保存和分发。不同的格式被称为不同的文件类型,它们通过不同的扩展名来识别。它们的格式取决于它们如何生成以及用于什么目的。它们全都存储为 XML 文件,可以打开和编辑。
下表列出了每种文件类型的说明及其用法。
File Type |
File Extension |
Purpose |
Tableau Workbook |
.twb |
它包含工作簿中存在的每一个工作表和仪表板的信息。它包含在每个视图中使用的字段的详细信息以及应用于度量聚合的公式。它还包含应用的格式和样式。它包含数据源连接信息以及为该连接创建的任何元数据信息。 |
Tableau Packaged Workbook |
.twbx |
此文件格式包含工作簿的详细信息以及分析中使用的本地数据。它的目的是与其他 Tableau Desktop 或 Tableau Reader 用户共享,假设它不需要来自服务器的数据。 |
Tableau Data Source |
.tds |
该文件存储用于创建 Tableau 报告的连接的详细信息。在连接详细信息中,它存储源类型(excel/关系型/sap 等)以及各列的数据类型。 |
Tableau Packaged Data source |
.tdsx |
该文件类似于 .tds 文件,不同之处在于它将连接详细信息添加到了数据中。 |
Tableau Data Extract |
.tde |
此文件包含高度压缩的列式数据格式 .twb 文件中使用的数据。这有助于优化存储。它还保存了在分析中应用的聚合计算。应刷新此文件以从源获取更新的数据。 |
Tableau Bookmark |
.tbm |
此类文件只包含一个工作表,可以轻松地将其粘贴到其他工作簿中以共享。 |
Tableau Preferences |
.tps |
此文件存储在所有工作簿中使用的颜色首选项。它主要用于在用户之间保持一致的外观和感觉。 |
Tableau - Data Types
作为数据分析工具,Tableau 将每条数据分类到四个类别之一,即字符串、数字、布尔值和日期时间。从源加载数据后,Tableau 会自动分配数据类型。相反,如果符合数据转换规则,您也可以更改一些数据类型。用户必须为计算字段指定数据类型。
下表列出了 Tableau 支持的数据类型的描述。
Data Type |
Description |
Example |
STRING |
零个或多个字符的任何序列。它们用单引号括起来。通过两次编写引号本身,可将其包含在字符串中。 |
'Hello' 'Quoted' 'quote' |
NUMBER |
这些是整数或浮点数。建议在计算中使用浮点数时对浮点数进行四舍五入。 |
3 142.58 |
BOOLEAN |
They are logical values. |
TRUE FALSE |
DATE & DATETIME |
Tableau 识别几乎所有格式的日期。但是,如果我们需要强制 Tableau 将字符串识别为日期,那么我们可以在数据之前加上 # 号。 |
"02/01/2015" "#3 March 1982" |
Tableau - Show Me
作为一种高级数据可视化工具,Tableau 不需要编写任何自定义代码,就可以通过提供许多分析技术让数据分析变得非常容易。Show Me 就是此类功能之一。它可以用于将必需的视图应用于工作表中的现有数据。这些视图可以是饼图、散点图或折线图。
每当创建包含数据的工作表时,它都可用在右上角,如下面图片所示。一些视图选项将根据数据窗格中选择的性质而变灰。
Tableau - Data Terminology
作为一款强大的数据可视化工具,Tableau 具有许多独特的术语和定义。在开始使用 Tableau 中的功能之前,您需要熟悉它们各自的含义。下面的术语列表比较全面,并且解释了最常用的术语。
S.No |
Terms & Meaning |
1 |
Alias 您可以赋予字段或维度成员的备用名称。 |
2 |
Bin 数据源中度量的一个用户定义组。 |
3 |
Bookmark Tableau 存储库中书签文件夹中的一个 .tbm 文件,包含一个工作表。非常像 Web 浏览器书签, .tbm 文件是一种快速显示不同分析的便捷方式。 |
4 |
Calculated Field 一个新字段,它是通过使用公式来修改数据源中的现有字段而创建的。 |
5 |
Crosstab 一个文本表视图。使用文本表来显示与维度成员关联的数字。 |
6 |
Dashboard 几个视图的组合,布置在单个页面上。使用仪表板同时比较和监视各种数据。 |
7 |
Data Pane 工作簿左侧的一个窗格,其中显示 Tableau 连接到的数据源的字段。这些字段分为维度和度量。数据窗格还会显示自定义字段,如计算、已分箱字段和组。通过将字段从数据窗格拖动到各个工作表中的各个货架上来构建数据视图。 |
8 |
Data Source Page 一个页面,您可以在其中设置数据源。数据源页面通常由四个主要区域组成−右窗格、连接区域、预览区域和元数据区域。 |
9 |
Dimension 一个分类数据字段。维度通常保存分层结构和成员等离散数据,这些无法聚合。维度的示例包括日期、客户姓名和客户细分。 |
10 |
Extract 数据源的可保存子集,可用于提升性能和进行离线分析。您可以通过定义筛选器和限制来创建包含您想要在萃取中放入的数据的萃取。 |
11 |
Filters Shelf 工作簿左边的架子,您可以使用它通过筛选来排除某个视图中的数据,所使用的筛选基于度量和维度。 |
12 |
Format Pane 包含格式设置的面板,控制整个工作表以及视图中的各个字段。打开时,“格式”面板显示在工作簿左侧。 |
13 |
Level Of Detail (LOD) Expression 支持在除视图级别之外的其他维度聚合的语法。通过详细级别的表达式,您可以将一个或多个维度连接到任意聚合表达式。 |
14 |
Marks 一个部分视图,可视化表示数据源中的一行或多行。标记可以是条形、直线或方块。您可以控制标记的类型、颜色和大小。 |
15 |
Marks Card 视图左边的卡片,您可以将字段拖放到其中来控制标记属性,比如类型、颜色、大小、形状、标签、工具提示和详细内容。 |
16 |
Pages Shelf 视图左边的架子,您可以使用它将视图拆分为一组页面,依据离散或连续字段中的成员和值。将字段添加到“页面”架子就如同将字段添加到“行”架子,不同之处在于,将为每一行创建新的页面。 |
17 |
Rows Shelf 工作簿顶部的架子,您可以使用它来创建数据表的行。该架子接受任意数量的维度和度量。当您将维度放在“行”架子上时,Tableau 会创建该维度成员的标题。当您将度量放在“行”架子上时,Tableau 会创建该度量的定量轴。 |
18 |
Shelves 视图左部和上部的命名区域。您可以通过在架子上放置字段来构建视图。只有在您选择特定标记类型时,某些架子才会可用。例如,“形状”架子仅在您选择“形状”标记类型时可用。 |
19 |
Workbook 一个包含一个或多个工作表(并且可能还包含仪表板和故事)的 .twb 扩展名的文件。 |
20 |
Worksheet 您可以通过将字段拖到架子上,来构建和查看数据。 |
Tableau - Data Sources
Tableau 可以连接到广泛使用的所有流行数据源。Tableau 的本机连接器可以连接到以下类型的数据源。
-
File Systems 如 CSV、Excel 等。
-
Relational Systems 如 Oracle、Sql Server、DB2 等。
-
Cloud Systems 如 Windows Azure、Google BigQuery 等。
-
Other Sources using ODBC
下图显示了 Tableau 的本机数据连接器可提供的多数数据源。
Tableau - Custom Data View
自定义数据视图用于扩展常规数据视图,并提供一些附加功能,以便视图可以针对相同的基础数据给出不同类型的图表。例如,您可以深入挖掘维度字段,这是预定义层次结构的一部分,以便获得以不同粒度获得的度量附加值。以下是 Tableau 提供的一些常用的重要自定义数据视图。
Tableau - Extracting Data
Tableau 中的数据提取从数据源中创建数据子集。这通过应用筛选器来提高性能很有用。它还有助于将 Tableau 的一些功能应用于数据,而这些功能可能在数据源中不可用,例如查找数据中的不同值。但是,数据提取功能最常用于创建要存储在本地驱动器中的提取,以便 Tableau 可脱机访问。
Applying Extract Filters
要从数据源中提取数据子集,您可以创建筛选器,这些筛选器将仅返回相关行。让我们考虑 Sample Superstore 数据集并创建提取。在筛选器选项中,选择“从列表中选择”,然后选中要从源中提取数据所需复选框值。
Tableau - Fields Operations
Tableau 有许多功能可用于操纵 Tableau 数据窗格中显示的字段。您可以重命名字段或合并两个字段以创建单个字段。此类操作有助于更好地组织维度和度量,以及针对两个或多个同名字段执行更好的数据分析。
以下是此类字段操作的一些重要示例。
Adding Fields to Worksheet
您可以通过右键单击并选择添加到工作表的选项向工作表添加任意字段。您还可以将字段拖放到工作表中存在的不同容器中,例如“列”容器、“行”容器、“筛选器”容器以及标记卡下的许多其他容器。下图显示了右键单击选项。
Tableau - Editing Metadata
连接到数据源后,Tableau 会捕获源的元数据详细信息,如列及其数据类型。这用于在视图中创建维度、度量和计算字段。可以浏览元数据并更改其中一些属性以满足某些特定要求。
Checking the Metadata
连接到数据源后,Tableau 会显示源中存在的所有可能表和列。考虑源“Sample Coffee shop”以检查元数据。单击数据菜单,然后选择连接到数据源。浏览名为“Sample - Coffee shop”的 MS access 文件。将名为 Product 的表拖到数据画布。在选择文件时,你将获得以下屏幕,其中显示列名称及其数据类型。字符串数据类型显示为 Abc ,而数字数据类型显示为 #。
Tableau - Data Joining
数据连接是任何数据分析中非常常见的需求。您可能需要连接来自多个来源的数据或连接单个来源中来自不同表的数据。Tableau 提供了使用数据菜单下编辑数据源中提供的“数据”窗格连接表的功能。
Creating a Join
考虑数据源“示例超级商店”,在“订单”和“退货”表之间创建连接。为此,请转到数据菜单并选择编辑数据源选项。接下来,将两个表(订单和退货)拖到“数据”窗格。Tableau 将根据字段名称和数据类型自动创建连接,此连接以后可以更改。
下图显示了使用字段订单 ID 创建订单和退货之间的内部连接。
Tableau - Data Blending
数据混合是 Tableau 中一个非常强大的功能。当多个数据源中存在相关数据时,您希望将它们分析到单个视图中,这时就使用数据混合。例如,考虑了在关系数据库中的销售数据和 Excel 电子表格中的销售目标数据。现在,为了将实际销售额与目标销售额进行比较,您可以基于公共维度混合数据以获取 Sales Target 度量。数据混合中的两个源被称为主要数据源和辅助数据源。在主要数据源和辅助数据源之间创建左连接,其中包括主要数据源的所有数据行以及来自辅助数据源的匹配数据行。
Preparing Data for Blending
Tableau 有两个内置数据源 Sample-superstore 和 Sample coffee chain.mdb ,它们将用于说明数据混合。
首先,将示例咖啡连锁店加载到 Tableau 并查看其元数据。转到菜单 - Data → New Data Source 并浏览示例咖啡连锁店文件,它是一个 MS Access 数据库文件。下面的屏幕截图显示了文件中提供的不同表和连接。
Tableau - Paged Workbook
分页工作簿用于为维度或度量的不同值在不同页面中保存数据的视图。一个常见的示例是查看每种产品类型在特定销售区域中相对于其他产品类型的表现情况。由于每种产品类型的不同值都存储在一个单独的页面中,我们可以一次查看它们或将它们视为一个值范围。
Creating Paged Workbook
分页工作簿包含将字段放置在页面架上的工作表。考虑研究产品不同子类别在不同地区的利润的示例。以下为步骤。
Step 1 − 创建具有两个维度和一个度量的条形图。在此情况下,将度量“利润”拖动到列架,将维度“子类别”和“地区”拖动到行架,如下图所示。
Step 2 - 再次将子类别字段拖到页面栏。你将看到自动添加了一个页面控件,就在页面栏的下方。此页面控件提供以下功能,以导航视图中的页面:
-
跳转到特定页面
-
手动浏览页面
-
Automatically advance through pages
在此示例中,我们将了解如何跳转到特定页面以及如何获取页面的自动显示。要转到特定页面,请单击页面控件上的下拉列表,然后选择配件。出现以下屏幕截图所示的图表。
Step 3 - 对于页面的自动显示,保持显示历史记录复选框被选中,然后单击播放按钮。然后可以看到子类别的不同页面自动播放。当前子类别值显示为暗色,而前值则以浅色显示。以下屏幕截图对此进行了说明。
Tableau - Operators
运算符是一个符号,它告诉编译器执行特定的数学或逻辑操作。Tableau 具有许多运算符,用于创建计算字段和公式。
以下是可用运算符的详细信息以及运算的顺序(优先级)。
Types of Operator
-
General Operators
-
Arithmetic Operators
-
Relational Operators
-
Logical Operators
General Operators
下表显示了 Tableau 支持的通用运算符。这些运算符作用于数字、字符和日期数据类型。
Operator |
Description |
Example |
+(addition) |
添加两个数字。连接两个字符串。将天数添加到日期。 |
7 + 3Profit + Sales’abc' + 'def' = 'abcdef' April 15, 2004 + 15 = April 30, 2004 |
–(subtraction) |
减去两个数字。从日期中减去天数。 |
-(7+3) = -10 April 16, 2004 - 15 = April 1, 2004 |
Arithmetic Operators
下表显示了 Tableau 支持的算术运算符。这些运算符仅对数字数据类型起作用。
Operator |
Description |
Example |
*(Multiplication) |
Numeric multiplication |
23*2 = 46 |
/(Division) |
Numeric division |
45/2 = 22.5 |
%(modulo) |
Reminder of numeric division |
13 % 2 = 1 |
^(power) |
Raised to the power |
2^3 = 8 |
Comparison Operators
下表列出了 Tableau 支持的比较运算符。这些运算符用于表达式中。每个运算符将比较两个数字、日期或字符串,并返回布尔值(真或假)。然而,布尔值本身无法使用这些运算符比较。
Operator |
Description |
Example |
= = or = (Equal to) |
比较两个数字或两个字符串或两个日期是否相等。如果相等,则返回布尔值真,否则返回假。 |
‘Hello’ = ‘Hello’ 5 = 15/ 3 |
!= or <> (Not equal to) |
比较两个数字或两个字符串或两个日期是否不相等。如果不相等,则返回布尔值真,否则返回假。 |
‘Good’ <> ‘Bad’ 18 != 37 / 2 |
> (Greater than) |
比较两个数字或两个字符串或两个日期,其中第一个参数大于第二个参数。如果如此,则返回布尔值真,否则返回假。 |
[Profit] > 20000 [Category] > ‘Q’ [Ship date] > April 1, 2004 |
< (Less than) |
比较两个数字或两个字符串或两个日期,其中第一个参数小于第二个参数。如果如此,则返回布尔值真,否则返回假。 |
[Profit] < 20000 [Category] < ‘Q’ [Ship date] < April 1, 2004 |
Logical Operators
下表显示了 Tableau 支持的逻辑运算符。这些运算符用于表达式中,该表达式的结果为布尔值,输出为真或假。
Operator |
Description |
Example |
AND |
如果 AND 运算符两侧的表达式或布尔值被评估为真,则结果为真。否则结果为假。 |
[Ship Date] > April 1, 2012 AND [Profit] > 10000 |
OR |
如果 AND 运算符两侧的一个或两个表达式或布尔值被评估为 TRUE,则结果为 TRUE。否则结果为 FALSE。 |
[发货日期] > April 1, 2012 或 [利润] > 10000 |
NOT |
此运算符否定其之后表达式布尔值。 |
NOT [发货日期] > April 1, 2012 |
Tableau - Functions
任何数据分析都涉及大量计算。在 Tableau 中,计算编辑器用于将计算应用于正在分析的字段。Tableau 具有许多内置函数,有助于创建复杂计算的表达式。
以下是不同函数类别的说明。
-
Number Functions
-
String Functions
-
Date Functions
-
Logical Functions
-
Aggregate Functions
Number Functions
这些是用于数字计算的函数。它们仅将数字作为输入。以下是一些重要的数字函数示例。
Function |
Description |
Example |
CEILING (number) |
将数字舍入到相等或更大的最近整数。 |
CEILING(2.145) = 3 |
POWER (number, power) |
将数字提高到指定的幂。 |
POWER(5,3) = 125 |
ROUND (number, [decimals]) |
将数字舍入到指定数量的位数。 |
ROUND(3.14152,2) = 3.14 |
String Functions
字符串函数用于字符串处理。以下是带有示例的一些重要的字符串函数
Function |
Description |
Example |
LEN (string) |
返回字符串的长度。 |
LEN("Tableau") = 7 |
LTRIM (string) |
返回删除所有前导空格的字符串。 |
LTRIM(" Tableau ") = "Tableau" |
REPLACE (string, substring, replacement) |
在字符串中搜索子字符串并用替换内容替换它。如果找不到子字符串,则字符串保持不变。 |
REPLACE("GreenBlueGreen", "Blue", "Red") = "GreenRedGreen" |
UPPER (string) |
返回字符串,所有字符都大写。 |
UPPER("Tableau") = "TABLEAU" |
Date Functions
Tableau 具有各种日期函数来执行涉及日期的计算。所有日期函数都使用 date_part ,这是一个字符串,指定日期的一部分,例如月份、日期或年份。下表列出了一些重要的日期函数示例。
Function |
Description |
Example |
DATEADD (date_part, increment, date) |
返回添加到日期的增量。增量类型在 date_part 中指定。 |
DATEADD ('month', 3, 2004-04-15 ) = 2004-0715 12:00:00 AM |
DATENAME (date_part, date, [start_of_week]) |
返回日期的 date_part 值(字符串形式)。 start_of_week 参数可选。 |
DATENAME('month', 200404-15) = "April" |
DAY (date) |
返回给定日期的日期值(整数形式)。 |
DAY(2004-04-12) = 12 |
NOW( ) |
返回当前日期和时间。 |
NOW( ) = 2004-04-15 1:08:21 PM |
Logical Functions
这些函数计算某些单一值或表达式的结果,并生成布尔输出。
Function |
Description |
Example |
IFNULL (expression1, expression2) |
如果结果不为 null,则 IFNULL 函数返回第一个表达式;如果结果为 null,则返回第二个表达式。 |
IFNULL([Sales], 0) = [Sales] |
ISDATE (string) |
如果字符串参数可以转换为日期,则 ISDATE 函数返回 TRUE,否则返回 FALSE。 |
ISDATE("11/05/98") = TRUEISDATE("14/05/98") = FALSE |
MIN(expression) |
该 MIN 函数返回所有记录的表达式的最小值或每条记录的两个表达式的最小值。 |
Tableau - Numeric Calculations
Tableau 中的数字计算使用公式编辑器中提供的广泛内置函数来完成。
在本章中,我们将看到如何将计算应用到字段。计算可以像减去两个字段的值或对单个字段应用聚合函数一样简单。
以下是在 Tableau 中创建计算字段并使用数字函数的步骤。
Tableau - String Calculations
在本章中,你将了解 Tableau 中涉及字符串的计算。Tableau 具有许多内置的字符串函数,可用于执行字符串操作,例如 - 比较、级联、替换字符串中的几个字符等。以下是创建计算字段并在其中使用字符串函数的步骤。
Tableau - Date Calculations
日期是大多数数据分析场景中广泛使用的一个关键字段。因此,Tableau 提供了许多涉及到日期的内置函数。你可以进行简单的日期操作,例如添加或减去日期中的天数。你还可以创建涉及到日期的复杂表达式。
以下是创建计算字段并在其中使用日期函数的步骤。
Tableau - Table Calculations
这些计算应用于整个表中的值。例如,要计算一个累积总计或累积平均值,我们需要对一整列应用一个单一的计算方法。这类计算无法在某些选定的行上执行。
表有一个称为 Quick Table Calculation 的功能,该功能用于创建这类计算。在快速表计算中应用的步骤如下−
Step 1 −选择要应用表计算的度量,然后将其拖到列架子上。
Step 2 −右键单击该度量,然后选择选项“快速表计算”。
Step 3 −选择一个以下选项应用于该度量。
-
Running Total
-
Difference
-
Percent Difference
-
Percent of Total
-
Rank
-
Percentile
-
Moving Average
-
年初至今 (YTD) 总计
-
Compound Growth Rate
-
Year over Year Growth
-
年初至今 (YTD) 增长
Tableau - LOD Expressions
Level of Detail (LOD) expressions 用于在数据源级别运行涉及多个维度的复杂查询,而不是将所有数据传送到 Tableau 界面。添加维度到已经计算的聚合值是简单的示例。
Types of LOD
有三种主要的 LOD 表达式类型。
-
FIXED LOD 此表达式使用指定维度计算值,不参考视图中的任何其他维度。
-
INCLUDE LOD 此详细级别表达式使用指定维度及视图中存在的任何维度来计算值。
-
EXCLUDE LOD 这些详细级别表达式从视图详细级别中减去维度。
FIXED Level of Detail Expressions
找出每个地区每个州的销售额。在此,首先使用如下屏幕截图中所示的公式创建名为区域销售的公式字段。
接下来,将区域和州字段拖放到行搁置,并将计算字段拖放到标记卡下的文本搁置。还要将区域字段拖放到颜色搁置。这会生成以下视图,显示不同州的固定值。这是因为我们已将维度固定为区域以便计算销售额。
Tableau - Basic Sorting
Tableau - Basic Filters
筛选是移除结果集中某些值或值范围的过程。Tableau 筛选功能允许使用字段值以及高级计算或基于上下文的筛选器,以适应各种情况。在本章中,您将了解 Tableau 中提供的一些基本筛选器。
Tableau 中提供了三种类型的基本筛选器。它们如下所示 -
-
Filter Dimensions 应用于维度字段的筛选器。
-
Filter Measures 应用于度量字段的筛选器。
-
Filter Dates 应用于日期字段的筛选器。
Tableau - Quick Filters
Tableau 中的许多筛选器类型都可以通过右键单击维度或度量轻松使用。这些称为快速筛选器的筛选器具有足够的功能来解决大多数常见的筛选需求。
以下屏幕截图显示了如何访问快速筛选器。
下面列出了各种快速筛选器及其用途。
Filter name |
Purpose |
Single Value (List) |
从列表中一次选择一个值。 |
Single Value (Dropdown) |
从下拉列表中选择单个值。 |
Multiple Values (List) |
从列表中选择一个或多个值。 |
Multiple Values (Dropdown) |
从下拉列表中选择一个或多个值。 |
Multiple Values (Custom List) |
搜索并选择一个或多个值。 |
Single Value (Slider) |
拖动水平滑块选择单个值。 |
Wildcard Match |
选择包含指定字符的值。 |
Tableau - Context Filters
Tableau 中的普通筛选器彼此独立。这意味着每个筛选器都会读取源数据中的所有行,并创建其自己的结果。但是,在某些情况下,您可能希望第二个筛选器仅处理第一个筛选器返回的记录。在这种情况下,第二个筛选器称为从属筛选器,因为它们仅处理通过上下文筛选器的数据。上下文筛选器有两种主要用途。
-
Improves performance - 如果您设置了很多筛选器或者数据源较大,则查询可能会很慢。您可以设置一个或更多上下文筛选器以提高性能。
-
Creates a dependent numerical or top N filter - 您可以设置上下文筛选器仅包括相关数据,然后设置一个数值或前 N 个筛选器。
Creating Context Filter
使用示例超级商店,找出称为家具的类别的产品前 10 个子类。为实现此目标,请执行以下步骤。
Step 1 - 将维度子类拖到行功能区,将度量销售额拖到列功能区。选择水平条形图作为图表类型。将维度子类再次拖到筛选器功能区。您将获得以下图表。
Step 2 - 右键单击筛选器功能区中的字段子类,然后转到名为顶部选项的第四个选项卡。按字段选择选项。从下一个下拉列表中,选择按销售金额前 10 名,如下图所示。
Step 3 - 将维度类别拖到筛选器功能区。右键单击进行编辑并在常规选项卡下从列表中选择家具。正如您所见的,结果显示了三个产品子类别。
Step 4 - 右键单击类别:家具筛选器,然后选择添加到上下文选项。这就生成了最终结果,显示了家具类别中排在前 10 个子类别中的产品子类别。
Tableau - Condition Filters
Tableau 中一个重要的筛选选项是对现有筛选器应用一些条件。这些条件可以很简单,例如仅查找高于一定金额的销售,也可以基于某个公式来查找复杂条件。还可以应用条件来创建范围筛选器。
Creating a Condition Filter
使用 Sample-superstore,让我们找到所有细分市场中其销售额超过一百万的子类别产品。为实现这一目标,以下是步骤。
Step 1 − 将维度细分和度量销售拖放到列功能区。接下来,将维度子类别拖放到行功能区。选择水平条形图选项。您将获得以下图表。
Step 2 − 将维度子类别拖放到筛选器功能区。右键单击进行编辑,然后转到条件选项卡。在此,选择按字段进行单选按钮选项。从下拉菜单中,选择销售额、总和和大于或等于符号,并指定值 100000。
在完成上述两个步骤后,我们得到一张图表,该图表仅显示满足条件的销售额达到所需金额的产品子类别。此外,还会针对满足条件的所有细分市场显示此内容。
Tableau - Top Filters
Tableau 筛选器中的首要选项用于限制筛选器的结果集。例如,从销售额的众多记录中,您只想获取前 10 个值。您可以使用内置选项通过多种方式限制记录或通过创建公式来应用此筛选器。在本章中,您将探索内置选项。
Tableau - Filter Operations
任何数据分析和可视化工作都需要对数据进行广泛筛选。Tableau 提供各种筛选选项来满足这些需求。有很多内置函数用于使用维度和度量对记录应用筛选。度量的筛选选项提供了数字计算和比较。维度的筛选选项提供从列表中选择字符串值或使用自定义值列表。在本章中,你将了解各种选项以及编辑和清除筛选的步骤。
Creating Filters
通过将所需字段拖到标记卡上方筛选器面板中,可以创建筛选器。通过将度量销售额拖到列面板和维度子类别拖到行面板中,创建水平条形图。再次将度量销售额拖到筛选器面板中。创建此筛选器后,右键单击并从弹出菜单中选择编辑筛选器选项。
Tableau - Bar Chart
条形图以矩形条表示数据,条的长度与变量值的比例相同。当您将维度拖到行架并测量到列架时,Tableau 会自动生成条形图。我们还可以在“显示方式”按钮中使用条形图选项。如果数据不适合条形图,则该选项将自动变为灰色。
在 Tableau 中,可以使用维度和度量创建多种类型的条形图。
Simple Bar Chart
从示例超级商店中,选择维度,将利润拖到列架,并将子类别拖到行架。它会自动生成一个水平条形图,如以下屏幕截图所示。如果没有,您可以从“显示方式”工具中选择图表类型以获得以下结果。
Tableau - Line Chart
在折线图中,沿图表区域的两条轴取一个度量值和一个维度。每条观测记录的对值成为一个点,所有这些点的连接形成一条线,显示所选维度和度量值之间的变化或关系。
Simple Line Chart
选择一个维度和一个度量值来创建一个简单的折线图。将维度 Ship Mode(运输方式)拖到“列”栏架中,将销售额拖到“行”栏架中。从“标记”卡中选择“折线图”。您将获得以下折线图,显示不同运输方式的销售额变化情况。
Tableau - Pie Chart
Tableau - Crosstab
Tableau 中的交叉表图表也称为文本表,它以文本形式显示数据。该图表由一个或多个维度和一个或多个度量值组成。该图表还可以显示度量值字段值的不同计算,例如运行总计、百分比总计等。
Simple Crosstab
使用 Sample-superstore(样品超级商店),我们计划获得每个区域中每个细分市场的销售金额。您需要使用可用的订单日期,按年份显示此数据。为实现此目标,请执行以下步骤。
Step 1 − 将维度顺序日期拖放到列功能区。
Step 2 − 将维度区域和细分拖放到行功能区。
Step 3 − 将度量销售拉到“标记”下的标签功能区。
将显示以下图表,其中显示交叉表。
Tableau - Scatter Plot
顾名思义,散点图显示了许多散布在笛卡尔平面上的点。它通过将数值变量的值绘制为笛卡尔平面中的 X 和 Y 坐标来创建。Tableau 至少需要一行架中的一个度量和一列架中的一个度量来创建散点图。但是,我们可以向散点图中添加维度字段,这些字段会在散点图中已存在的点上标记不同的颜色。
Tableau - Bubble Chart
Tableau - Bullet Graph
子弹图是条形图的一种变体。在此图表中,我们在一个范围内查找第二个度量中的变化的情况下,将一个度量的值与另一个度量进行比较,以找出第一个度量中的变化。这就像两个条形相互叠加一样,它们以图表的同一位置表示各自的值。可以将其视为将两个图表合并为一个图表,以便轻松查看比较结果。
Tableau - Box Plot
箱线图又称为盒须图。它们显示沿轴分布的值。盒子表示中间 50% 的数据,即数据分布的中间两个四分位数。其余 50% 的数据在两侧由也称为须线的线表示,以显示不超过四分位间距 1.5 倍的所有点,即不超过邻接盒子宽度的 1.5 倍的所有点,或数据最大程度的所有点。
箱线图采用一个或多个度量,维度为零或多个。
Tableau - Tree Map
Tableau - Bump Chart
凸点图用于根据度量值,将两个维度相互比较。它们对于探索值在时间维度、地点维度或与分析相关的其他维度上的排名的变化非常有用。
凸点图包含两个维度,其中包含零个或更多度量值。
Creating a Bump Chart
使用 Sample-superstore(样品超级商店),计划查找产品运输方式与子类别变化之间的差异。为实现此目标,请执行以下步骤。
Step 1 - 将维度 Sub-Category(子类别)拖放到“列”栏架中。此外,将维度 Ship mode(运输方式)拖到“标记”卡下的“颜色”栏架中。将图表类型保留为“自动”。将出现以下图表。
Step 2 - 接下来的,创建一个名为 Rank(排名)的计算字段。转到 Analysis(分析)→ Create Calculated Field(创建计算字段)。使用 Rank(排名)作为字段名称,并在运算区域中编写表达式 index()。这是一个内置函数,用于为分区中的当前行创建索引。单击“确定”,新字段将显示在度量值部分中。右键单击字段 Rank(排名),并将其转换为离散字段。
Step 3 - 将 Rank(排名)拖到“行”栏架中。将出现以下图表,其中显示了维度 Sub-Category(子类别),其中每个运输方式均以其排名值的递增顺序排列。
Step 4 - 使用度量值利润对排名字段应用其他计算。右键单击 Rank(排名)并选择 Edit Table Calculation(编辑表格计算)。根据子类别分区并按运输方式设置,选择按利润字段进行排序。以下屏幕截图显示了应用的计算。
完成上述步骤后,您将获得如下图所示的凸点图。它显示了各个子类别中每个运输方式的利润变化情况。
Tableau - Gantt Chart
甘特图显示了任务或资源的价值在一特定时间段内的进度。在项目管理和其他类型的一段时间内的变异研究中,它被广泛使用。因此,在甘特图中,时间维度是一个基本字段。
甘特图除了时间维度之外,至少需要一个维度和一个度量。
Creating a Gantt Chart
使用 Sample-superstore 计划根据一段时间内不同的产品子类别的运输方式来找出数量的变化。要实现这一目标,请按照以下步骤操作。
Step 1 − 将维度 order date 拖动到 Columns 货架,将 Sub-Category 拖动到 Rows 货架。然后,将 order date 添加到 Filters 货架。右键单击 order date 将其转换为精确的日期值,如下面的屏幕截图所示。
Step 2 − 编辑筛选条件以选择一个日期范围。这是因为您希望获取各个日期值,而数据中有很多日期。该范围的创建方式如下面的屏幕截图所示。
Step 3 − 将维度 ship mode 拖动到 Color 货架,将度量 quantity 拖动到 Marks 卡片下的 Size 货架。这样就能生成甘特图,如下面的屏幕截图所示。
Tableau - Histogram
直方图表示已分段到范围中的变量值的频率。直方图类似于条形图,但它将值分组到连续范围内。直方图中的每个条形表示该范围内存在的值的数量的高度。
Tableau 通过采用一个度量来创建直方图。它为用于创建直方图中的度量创建了一个附加分段字段。
Tableau - Motion Charts
动态图表使用 X 轴和 Y 轴显示数据,通过显示限定空间内数据点的运动以及线条颜色的变化来展示数据随时间的变化。动态图表的最大优势在于可以查看数据随时间变化的整个轨迹,而不仅仅是数据的快照。
Tableau 需要一个时间维度和一个度量来创建动态图表。
Creating a Motion Chart
使用示例超级商店,计划找出月度的利润变化。为实现这一目标,以下为步骤。
Step 1 − 将维度订单日期拖到列功能区。再次将其拖到页功能区。在页功能区中,右键单击订单日期并选择“月份”。然后将度量利润拖到行功能区。将出现以下图表。
Step 2 − 选中展示历史记录旁边的复选框,然后单击其旁边的下拉箭头。对于“要为其展示历史记录的标记”,选择“全部”。然后在“展示”下,选择“两者”。选择“标记”只显示点,选择“轨迹”只显示线条。单击播放按钮。将出现以下图表。
Step 3 − 让图表从 1 月运行到 12 月将创建一个图表,该图表显示每年每个月的利润如何变化。请注意,随着数据的变化,最近几个月会变成较深的颜色,而历史数据会变成较浅的颜色。
最后,您将获得以下图表。
Tableau - Waterfall Charts
瀑布图有效地显示顺序正负值的累积效应。它显示了值从哪里开始、结束以及如何递增到达那里。因此,我们能够看到连续数据点之间变化的大小和值的差异。
Tableau 需要一个维度和一个度量来创建瀑布图。
Creating a Waterfall Chart
使用 Sample-superstore,计划查找每个产品子类的销售额变化。要实现此目标,请执行以下步骤。
Step 1 - 将维度子类别拖到“列”栏架中,将度量值销售额拖到“行”栏架中。按照递增的销售值对数据进行排序。为此,在将鼠标悬停在垂直轴中部时,使用显示在该轴中间的排序选项。完成此步骤后,将出现以下图表。
Step 2 - 接下来的,右键单击“总和 (销售额)”值,并从表格计算选项中选择“运行总计”。将图表类型更改为“甘特条形图”。将出现以下图表。
Step 3 - 创建一个名为 -sales 的计算字段,并为此计算字段的值提及以下公式。
Step 4 - 将新创建的计算字段 (-sales) 拖到“标记”卡下的“大小”栏架中。上面的图表现在更改为生成以下图表,即瀑布图。
Tableau - Dashboard
仪表板是许多工作表和相关信息在一个地方的汇总显示。它用于同时比较和监控各种数据。不同的数据视图都会同时显示。仪表板显示在工作簿底部的选项卡中,并且通常会使用来自数据源的最新数据进行更新。在创建仪表板时,您可以从工作簿中的任何工作表中添加视图以及许多支持对象,例如文本区域、网页和图像。
您添加到仪表板的每个视图都连接到其相应的工作表。因此,当您修改工作表时,仪表板将更新,当您修改仪表板中的视图时,工作表也会更新。
Creating a Dashboard
使用 Sample-superstore,计划创建一个仪表板,显示跨所有州的不同细分和产品子类别的销售额和利润。为实现此目标,步骤如下。
Step 1 − 使用位于工作簿底部的添加工作表图标创建一个空白工作表。将维度细分拖到“列”选区,将维度子类别拖到“行”选区。将度量销售额拖放到“颜色”选区,将度量利润拖放到“大小”选区。此工作表称为主工作表。右键单击并重命名此工作表为 Sales_Profits 。出现以下图表。
Step 2 − 创建另一个表格以保存跨不同州的销售额详细信息。为此,将维度州拖到“行”选区,将度量销售额拖到“列”选区,如以下屏幕截图所示。接下来,对州字段应用筛选器以按降序排列销售额。右键单击并重命名此工作表为 Sales_state 。
Step 3 − 接下来,通过单击工作簿底部的创建新仪表板链接创建一个空白仪表板。右键单击并重命名仪表板为 Profit_Dashboard。
Step 4 − 将两个工作表拖到仪表板中。在销售利润工作表的顶部边框线附近,您可以看到三个小图标。单击中间图标,当将鼠标悬停在该图标上时,该图标会显示提示使用作为筛选器。
Step 5 − 现在在仪表板中,单击名为机器细分和名为消费细分的代表子类别的框。
您会注意到,只有销售额达到此利润的州才会在名为 Sales_state 的右侧窗格中筛选出来。这说明了如何在仪表板中链接表格。
Tableau - Formatting
Tableau 具有非常广泛的格式化选项,可以用来更改所创建的可视化内容的外观。你可以修改几乎每一个方面,例如字体、颜色、大小、布局等。你可以对内容和容器进行格式化,例如表、轴标签和工作簿主题等。
下图显示了列出选项的格式菜单。在本章中,你将了解一些常用的格式化选项。
Tableau - Forecasting
预测是预测度量的未来值。有许多用于预测的数学模型。Tableau 使用称为 exponential smoothing 的模型。在指数平滑中,最近的观察值比更早的观察值赋予更大的权重。这些模型捕捉到数据变化的趋势或季节性并将其推断到未来。预测结果还可以成为创建的可视化中的一项。
Tableau 采用时间维度和度量字段来创建预测。
Tableau - Trend Lines
趋势线用于预测变量特定趋势的延续。它还有助于通过同时观察两个变量中的趋势来识别两个变量之间的相关性。有许多数学模型用于建立趋势线。Tableau 提供了四个选项。它们分别是线性、对数、指数和多项式。本章仅讨论线性模型。
Tableau 采用时间维度和度量字段来创建趋势线。