Ggplot2 简明教程

ggplot2 - Scatter Plots & Jitter Plots

散点图与折线图类似,通常用于绘制图形。散点图显示一个变量与另一个变量的关系。变量之间的关系称为相关性,它通常用于统计方法。我们将使用名为“Iris”的相同数据集,其中每个变量之间有很大的差异。这是著名的数据集,提供了 50 朵鸢尾花(3 个物种)中萼片长度和宽度以及花瓣长度和宽度的厘米测量值。这些物种分别被称为西伯利亚鸢尾、杂色鸢尾和弗吉尼亚鸢尾。

Creating Basic Scatter Plot

使用“ggplot2”软件包创建散点图需要以下步骤 −

可以执行以下命令来创建基本散点图 −

> # Basic Scatter Plot
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point()
creating basic scatter plot

Adding attributes

我们可以使用 geom_point() 函数中的一个名为 shape 的属性更改点的形状。

> # Change the shape of points
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point(shape=1)
adding attributes

我们可以为点添加颜色,添加在所需的散点图中。

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1)
adding attributes with color

在此示例中,我们根据图例中提到的物种创建了颜色。这三个物种在这个提到的图中有着独特的区别。

现在,我们将重点放在建立变量之间的关系上。

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)

geom_smooth 函数有助于重叠模式并创建所需变量的模式。

属性方法“lm”提到了需要开发的回归线。

> # Add a regression line
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)
geom smooth function

我们还可以添加一条无阴影置信区域的回归线,其语法如下所示:

># Add a regression line but no shaded confidence region
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm, se=FALSE)
add a regression line graph

阴影区域表示除了置信区域之外的事物。

Jitter Plots

抖动图包含可以描绘散点图的特殊效果。抖动只不过是一个随机值,分配给点以将其分离,如下所示:

> ggplot(mpg, aes(cyl, hwy)) +
+    geom_point() +
+    geom_jitter(aes(colour = class))
jitter plots