Ggplot2 简明教程

ggplot2 - Introduction

ggplot2 是一个 R 包,专门用于数据可视化并提供最佳探索性数据分析。它提供精美的、无忧无虑的图,可以处理细小的细节,例如绘制图例并表示它们。图可以迭代创建并稍后编辑。此包被设计为以分层方式工作,从一个图层开始,该图层显示使用 R 进行探索性数据分析期间收集的原始数据,然后添加标注和统计摘要的图层。

即使是最有经验的 R 用户在创建精美的图形时也需要帮助。这个库是用于在 R 中创建图形的非凡工具,但即使在多年几乎每天使用之后,我们仍然需要参考我们的备忘单。

此包使用称为“图形语法”的深度语法,它由一组可通过多种方式创建的独立组件组成。“图形语法” 是使 ggplot2 非常强大的唯一原因,因为 R 开发人员不局限于其他包中使用的预先指定图形集。语法包含一组简单核心理论和原则。

2005 年,Wilkinson 创建或更确切地说是创立了图形语法的概念,以描述包含在所有统计图形之间的深度特征。它专注于图层原语,包括改编嵌入 R 的功能。

Relationship between “Grammar of Graphics” and R

它告诉用户或开发者,统计图形用于将数据映射到美学属性,如点的颜色、形状、大小,线的颜色、形状、大小和条形图的颜色、形状、大小等涉及的几何对象。图表还可能包含涉及的数据的各种统计转换,这些转换绘制在上述坐标系中。它还包括一个称为“分面”的功能,通常用于针对上述数据集的不同子集创建相同图表。R 包含各种内置数据集。这些独立组件的组合完全构成了一个特定图形。

现在让我们关注可参考语法创建的不同类型的图表 -

Data

如果用户想可视化给定的美学映射集,它描述了数据中的所需变量是如何映射在一起以创建映射美学属性的。

Layers

它由几何元素和所需的统计转换组成。层包括几何对象、用于表示图表中的短数据的几何对象(geom),实际上它们使用点、线、多边形等表示图表。最好的演示是分类和统计观测值,以创建特定直线模型的二维关系的特定直方图。

Scales

缩放用于映射数据空间中的值,这些值用于创建值,无论它们是颜色、大小还是形状。它有助于绘制图例或轴线,需要提供一个逆向映射,使得可以从上述图表中读取原始数据值。

Coordinate System

它描述了如何将数据坐标一起映射到图形的上述平面。它还提供了阅读图表所需的坐标轴和网格线的信息。通常将其用作直角坐标系,其中包括极坐标和地图投影。

Faceting

它包括关于如何将数据分解为所需子集以及以数据倍数显示子集的说明。这也被称为条件化或格状处理。

Theme

它控制显示的细节部分,如字体大小和背景颜色属性。要创建一个具有吸引力的图表,最好总是考虑参考文献。

现在,讨论语法不提供的限制或特征也同样重要 -

  1. 它缺少应该使用的图形的建议或用户感兴趣的建议。

  2. 它不描述交互性,因为它仅包括对静态图形的描述。要创建动态图形,应该应用其他备选方案。

下面提到了使用 ggplot2 创建的简单图形 -

ggplot2 graph