Sas 简明教程

SAS - Correlation Analysis

相关分析处理变量之间的关系。相关系数是两个变量之间线性关系的度量。相关系数的值始终介于 -1 和 +1 之间。SAS 提供了过程 PROC CORR 在数据集的变量对之间查找相关系数。

Syntax

在 SAS 中应用 PROC CORR 的基本语法为:

PROC CORR DATA = dataset options;
VAR variable;

以下是所用参数的描述 -

  1. Dataset 是数据集的名称。

  2. Options 是过程的其他选项,如绘图矩阵等。

  3. Variable 是在查找相关性时使用的数据集的变量名。

Example

可以通过在 VAR 语句中使用名称来获取数据集中变量对之间的相关系数。在下面的示例中,我们使用数据集 CARS1 并获得显示马力和重量之间的相关系数的结果。

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

在执行以上代码后,我们将得到以下结果:

corr ana 2

Correlation Between All Variables

可以通过简单地将该过程与数据集名称一起应用来获取数据集中所有可用变量之间的相关系数。

Example

在下面的示例中,我们使用数据集 CARS1 并获得显示变量对之间各个相关系数的结果。

proc corr data = cars1 ;
run;

在执行以上代码后,我们将得到以下结果:

corr ana 1

Correlation Matrix

我们可以通过在 PROC 语句中选择绘图矩阵选项来获取变量之间的散点图矩阵。

Example

在下面的示例中,我们获得了马力和重量之间的矩阵。

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

在执行以上代码后,我们将得到以下结果:

corr ana 3