Sql 简明教程

UNION vs JOIN

SQL 提供了各种关系运算符来处理关系数据库中跨多表分散的数据。其中,UNION 和 JOIN 查询从本质上用于合并来自多表的数据。

即使它们都用于同一目的(即合并表),但这些运算符的工作方式之间存在许多差异。主要区别在于 UNION 运算符合并来自多个相似表的无关数据,而 JOIN 运算符仅用于合并来自多个表的相关数据。

Working of UNION

UNION 是 SQL 中的一种运算符/子句,其作用类似于关系代数中的并集运算符。它只是合并来自多个并集兼容表的的信息。

如果满足以下条件,则表被认为是并集兼容的:

  1. 要组合的表必须具有相同数量的具有相同数据类型的列。

  2. 行数不必相同。

满足这些条件后,UNION 运算符将所有来自多个表的行(消除重复行后)作为结果表返回。

Note - 第一张表的列名将成为结果表的列名,第二张表的的内容将合并到具有相同数据类型的结果列中。

Syntax

以下是 SQL UNION 运算符的语法:

SELECT * FROM table1
UNION
SELECT * FROM table2;

Example

我们首先使用相同数量且具有相同数据类型的列创建两个表“COURSES_PICKED”和“EXTRA_COURSES_PICKED”。

使用以下查询创建表 COURSES_PICKED:

CREATE TABLE COURSES_PICKED(
   STUDENT_ID INT NOT NULL,
   STUDENT_NAME VARCHAR(30) NOT NULL,
   COURSE_NAME VARCHAR(30) NOT NULL
);

使用下面给出的查询向 COURSES_PICKED 表中插入值:

INSERT INTO COURSES_PICKED VALUES
(1, 'JOHN', 'ENGLISH'),
(2, 'ROBERT', 'COMPUTER SCIENCE'),
(3, 'SASHA', 'COMMUNICATIONS'),
(4, 'JULIAN', 'MATHEMATICS');

使用以下查询创建一个 EXTRA_COURSES_PICKED 表 −

CREATE TABLE EXTRA_COURSES_PICKED(
   STUDENT_ID INT NOT NULL,
   STUDENT_NAME VARCHAR(30) NOT NULL,
   EXTRA_COURSE_NAME VARCHAR(30) NOT NULL
);

以下是在 EXTRA_COURSES_PICKED 表中插入值的查询 −

INSERT INTO EXTRA_COURSES_PICKED VALUES
(1, 'JOHN', 'PHYSICAL EDUCATION'),
(2, 'ROBERT', 'GYM'),
(3, 'SASHA', 'FILM'),
(4, 'JULIAN', 'PHOTOGRAPHY');

现在,让我们使用 UNION 查询合并表 COURSES_PICKED 和 EXTRA_COURSES_PICKED,如下所示 −

SELECT * FROM COURSES_PICKED
UNION
SELECT * FROM EXTRA_COURSES_PICKED;

Output

执行 UNION 操作后得到的结果表为 −

STUDENT_ID

STUDENT_NAME

COURSE_NAME

1

Jhon

English

1

Jhon

Physical Education

2

Robert

Computer Science

2

Robert

Gym

3

Shasha

Communications

3

Shasha

Film

4

Julian

Mathematics

4

Julian

Photography

Working of JOIN

Join 操作用于将多个相关表中的信息基于它们共同的字段合并到一张表中。该操作可以与 ON、WHERE、ORDER BY、GROUP BY 等各种子句一起使用。

有两种类型的 Join −

  1. Inner Join

  2. Outer Join

Join 的基本类型是内部联接,它只检索公用列的匹配值。它是默认的 join。

外部联接的结果表包含来自第一个表的匹配行和不匹配行。它分为左联接、右联接和全联接等子类型。

Syntax

以下是 SQL 中 Join 操作的基本语法 −

SELECT column_name(s)
FROM table1
JOIN table2
ON table1.column_name = table2.column_name;

Example

在以下示例中,我们将使用以下查询联接我们在上面创建的相同表,即 COURSES_PICKED 和 EXTRA_COURSES_PICKED -

SELECT c.STUDENT_ID, c.STUDENT_NAME, COURSE_NAME, COURSES_PICKED
FROM COURSES_PICKED c
JOIN EXTRA_COURSES_PICKED e
ON c.STUDENT_ID = e.STUDENT_ID;

Output

结果表将以以下方式显示 −

STUDENT_ID

STUDENT_NAME

COURSE_NAME

COURSE_PICKED

1

Jhon

ENGLISH

Physical Education

2

Robert

COMPUTER SCIENCE

Gym

3

Shasha

COMMUNICATIONS

Film

4

Julian

MATHEMATICS

Photography

UNION Vs JOIN

正如我们在上面给出的示例中看到的,UNION 运算符只能对可并集的表执行,而 JOIN 运算符则联接两个不必可并集但应该相关的表。

让我们在下面总结这些查询之间的所有区别 −

UNION

JOIN

UNION 操作仅对可并集的表执行,即表必须包含具有相同数据类型相同数量的列。

JOIN 操作可以在至少有一个公共字段的表上执行。这些表不必是可并集的。

合并的数据将作为结果表的新行添加。

合并的数据将作为新列并入结果表。

这作为合取运算。

这作为交集运算。

UNION 会从结果表中删除所有重复的值。

JOIN 会保留两张表中的所有值,即使它们是冗余的。

UNION 不需要额外的子句来合并两张表。

JOIN 需要额外的 ON 子句根据公共字段合并两张表。

UNION 通常用于将组织中的旧员工列表与新员工列表合并之类的场景中。

它用于在需要合并相关表时。比如,合并包含客户列表和他们进行的订单的表。