分享很少见很有用的SQL功能CORRESPONDING

前言

我最近偶然发现了一个标准的SQL特性,令我惊讶的是,这个特性在HSQLDB中实现了。这个关键字是CORRESPONDING ,它可以和所有的集合操作一起使用,包括UNION 、INTERSECT 、和EXCEPT 。

让我们来看看sakila数据库它有3个表:

CREATE TABLE actor (
 actor_id integer NOT NULL PRIMARY KEY,
 first_name varchar(45) NOT NULL,
 last_name varchar(45) NOT NULL,
 last_update timestamp
);

CREATE TABLE customer (
 customer_id integer NOT NULL PRIMARY KEY,
 store_id smallint NOT NULL,
 first_name varchar(45) NOT NULL,
 last_name varchar(45) NOT NULL,
 email varchar(50),
 address_id smallint NOT NULL,
 create_date date NOT NULL,
 last_update timestamp,
 active boolean
);

CREATE TABLE staff (
 staff_id integer NOT NULL PRIMARY KEY,
 first_name varchar(45) NOT NULL,
 last_name varchar(45) NOT NULL,
 address_id smallint NOT NULL,
 email varchar(50),
 store_id smallint NOT NULL,
 active boolean NOT NULL,
 username varchar(16) NOT NULL,
 password varchar(40),
 last_update timestamp,
 picture blob
);

相似,但不相同。如果我们想从我们的数据库中获得所有的 "人 "呢?在任何普通的数据库产品中,有一种方法可以做到这一点:

SELECT first_name, last_name
FROM actor
UNION ALL
SELECT first_name, last_name
FROM customer
UNION ALL
SELECT first_name, last_name
FROM staff
ORDER BY first_name, last_name

结果可能看起来像这样:

|first_name|last_name|
|----------|---------|
|AARON |SELBY |
|ADAM |GOOCH |
|ADAM |GRANT |
|ADAM |HOPPER |
|ADRIAN |CLARY |
|AGNES |BISHOP |
|AL |GARLAND |
|ALAN |DREYFUSS |
|... |... |

使用CORRESPONDING

现在,在HSQLDB中,以及在标准SQL中,你可以使用CORRESPONDING 来完成这种任务。比如说:

SELECT *
FROM actor
UNION ALL CORRESPONDING
SELECT *
FROM customer
UNION ALL CORRESPONDING
SELECT *
FROM staff
ORDER BY first_name, last_name

其结果是这样的:

|first_name|last_name|last_update |
|----------|---------|-----------------------|
|AARON |SELBY |2006-02-15 04:57:20.000|
|ADAM |GOOCH |2006-02-15 04:57:20.000|
|ADAM |GRANT |2006-02-15 04:34:33.000|
|ADAM |HOPPER |2006-02-15 04:34:33.000|
|ADRIAN |CLARY |2006-02-15 04:57:20.000|
|AGNES |BISHOP |2006-02-15 04:57:20.000|
|AL |GARLAND |2006-02-15 04:34:33.000|
|ALAN |DREYFUSS |2006-02-15 04:34:33.000|
|... |... |... |

那么,发生了什么?列FIRST_NAME,LAST_NAME, 和LAST_UPDATE 是这三个表所共有的。换句话说,如果你针对HSQLDB中的INFORMATION_SCHEMA ,运行这个查询:

SELECT column_name
FROM information_schema.columns
WHERE table_name = 'ACTOR'
INTERSECT
SELECT column_name
FROM information_schema.columns
WHERE table_name = 'CUSTOMER'
INTERSECT
SELECT column_name
FROM information_schema.columns
WHERE table_name = 'STAFF'

你得到的正是这3个列:

|COLUMN_NAME|
|-----------|
|FIRST_NAME |
|LAST_NAME |
|LAST_UPDATE|

换句话说,CORRESPONDING ,在集合操作的子查询中创建列的交集(即 "共享列"),投影这些,并应用该投影的集合操作。在某种程度上,这类似于一个 [NATURAL JOIN](https://blog.jooq.org/impress-your-coworkers-with-a-sql-natural-full-outer-join/),后者也试图找到列的交集以产生一个连接谓词。然而,NATURAL JOIN ,然后投影所有的列(或列的联合),而不仅仅是共享的列。

使用CORRESPONDING BY

就像NATURAL JOIN ,这是个有风险的操作。只要一个子查询改变了它的投影(例如,由于表的列重命名),所有这些查询的结果也会改变,甚至可能不会产生语法错误,只是结果不同。

事实上,在上面的例子中,我们可能根本不关心那个LAST_UPDATE 列。它被意外地包含在UNION ALL 的集合操作中,就像NATURAL JOIN 会意外地使用LAST_UPDATE 来连接一样。

对于连接,我们可以使用JOIN .. USING (first_name, last_name) ,至少指定我们想通过哪一个共享列名来连接这两个表。使用CORRESPONDING ,我们可以为同样的目的提供可选的BY 子句:

SELECT *
FROM actor
UNION ALL CORRESPONDING BY (first_name, last_name)
SELECT *
FROM customer
UNION ALL CORRESPONDING BY (first_name, last_name)
SELECT *
FROM staff
ORDER BY first_name, last_name;

现在,这只产生了两个想要的列:

|first_name|last_name|
|----------|---------|
|AARON |SELBY |
|ADAM |GOOCH |
|ADAM |GRANT |
|ADAM |HOPPER |
|ADRIAN |CLARY |
|AGNES |BISHOP |
|AL |GARLAND |
|ALAN |DREYFUSS |
|... |... |

事实上,这样一来,我们甚至可以有意义地使用INTERSECT和EXCEPT的语法,例如,找到与某个演员共享名字的客户:

SELECT *
FROM actor
INTERSECT CORRESPONDING BY (first_name, last_name)
SELECT *
FROM customer
ORDER BY first_name, last_name;

制作:

|first_name|last_name|
|----------|---------|
|JENNIFER |DAVIS |
作者:DebugUsery

%s 个评论

要回复文章请先登录注册