Ggplot2 简明教程
ggplot2 - Working with Axes
当我们谈论图表中的坐标轴时,它完全是关于以二维方式表示的 x 和 y 坐标轴。在本章中,我们将重点关注data科学家常用到的两个数据集“Plantgrowth”和“Iris”数据集。
Implementing axes in Iris dataset
我们将使用以下步骤使用 R 的 ggplot2 包处理 x 和 y 轴。
加载库以获取软件包的功能始终很重要。
# Load ggplot
library(ggplot2)
# Read in dataset
data(iris)
Creating the plot points
如前一章所述,我们将创建其中有点的图表。换句话说,它被定义为散点图。
# Plot
p <- ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) + geom_point()
p
现在让我们了解美学映射“ggplot2”的 aes 的功能。美学映射描述了绘图所需的可变结构以及应该在单个图层格式中管理的数据。
输出如下 −
Highlight and tick marks
如下所示,使用 x 和 y 坐标轴的上述坐标标记图。它包括添加文本、重复文本、突出显示特定区域和添加线段,如下所示 -
# add text
p + annotate("text", x = 6, y = 5, label = "text")
# add repeat
p + annotate("text", x = 4:6, y = 5:7, label = "text")
# highlight an area
p + annotate("rect", xmin = 5, xmax = 7, ymin = 4, ymax = 6, alpha = .5)
# segment
p + annotate("segment", x = 5, xend = 7, y = 4, yend = 5, colour = "black")
为添加文本生成的输出如下 -
使用已提及的坐标重复特定文本会产生以下输出。该文本由 4 到 6 的 x 坐标和 5 到 7 的 y 坐标生成 −
下面提供了特定区域输出的分割和突出显示 −
PlantGrowth Dataset
现在让我们专注于使用名为“Plantgrowth”的其他数据集,如下所示。
调用该库并查看“Plantgrowth”的属性。该数据集包含一个实验的结果,该实验比较在对照和两种不同的处理条件下获得的产量(以植物的干重衡量)。
> PlantGrowth
weight group
1 4.17 ctrl
2 5.58 ctrl
3 5.18 ctrl
4 6.11 ctrl
5 4.50 ctrl
6 4.61 ctrl
7 5.17 ctrl
8 4.53 ctrl
9 5.33 ctrl
10 5.14 ctrl
11 4.81 trt1
12 4.17 trt1
13 4.41 trt1
14 3.59 trt1
15 5.87 trt1
16 3.83 trt1
17 6.03 trt1