条件查询
SQL 条件查询
限制查询是筛选结果集的一种方法,但是我们可以使用 WHERE 子句获得更多具体信息。WHERE 命令后跟您要过滤的条件。
SELECT * FROM artists WHERE [Filter Conditions];
Conditions
条件只是对或错的陈述。数据库将使用这些语句并在扫描表时评估所有行中的语句,并仅返回真实结果。举例来说,假设我们要查看 ID 为 85 的艺术家的姓名。条件为 id = 85。请通过运行以下查询来尝试该条件:
SELECT * FROM artists WHERE id = 85;
该查询指示数据库扫描 Artists 表并获取条件(id = 85)为真的所有行。如您所见,唯一 ID 为 85 的艺术家是 Frank Sinatra。或者,如果我们要查找“Santana”上的所有信息,则条件将为 name=“Santana”
:
SELECT * FROM artists WHERE name = 'Santana';
多项匹配
在上面的示例中,我们正在查询唯一字段,因此我们只能得到一个答案。但是,情况并非总是如此。在轨道表中,许多不同的轨道属于同一张专辑,您可以看到在轨道数据库中有一个 album_id 列。例如,如果我们要获取属于专辑的所有曲目,其 ID 为 89,则可以运行:
SELECT * FROM tracks WHERE album_id = 89;
条件组合
AND
在 SQL 中,您可以按任意数量的条件进行过滤。您可以通过在每个新条件之间使用 AND 运算符来添加其他条件。让我们看一下上面写的查询,说我们只想要专辑 89(American Idiot)中的曲目,并且也仅由 Green Day 自己创作。
SELECT * FROM tracks WHERE album_id = 89 AND composer = 'Green Day';
OR
当您关心是否两个条件都为真时,也可以使用 OR 来定义多个 WHERE 条件。例如,以下查询返回由“Green Day”或“ AC / DC”组成的轨道。
SELECT * FROM tracks WHERE composer='Green Day' OR composer='AC/DC';
NOT
您可以通过简单地将 NOT 运算符放在条件前面来反转条件。例如,以下查询不是由 Green Day 组成的所有内容。
SELECT * FROM tracks WHERE NOT composer='Green Day';
Ordering and Parenthesis
您可以结合使用任意数量的 OR 和 AND 命令来描述您的条件。就像在数学课中一样,SQL 具有一个操作顺序。AND 本质上是逻辑乘法],而 OR 是逻辑加法,因此先执行与运算的条件,然后才执行或运算。
就像数学一样,您可以使用括号指定运算顺序。最佳做法是,在逻辑和顺序不太明确的地方使用括号。为了进行探索,让我们尝试拉动所有组成“ Green Day”的曲目,以及通过 AC / DC 进行的超过 240,000 毫秒的所有曲目。
SELECT * FROM tracks WHERE composer = 'Green Day' OR (composer = 'AC/DC' AND milliseconds > 240000);
请注意,使用括号可以清楚地表明我们只想要更长的 AC / DC 歌曲。您会看到仍然列出了低于 240,000 毫秒的“Green Day”歌曲。但是,如果我们更改括号,则逻辑也会将毫秒条件应用于所有 Green Day 歌曲。
SELECT * FROM tracks WHERE (composer = 'Green Day' OR composer = 'AC/DC') AND milliseconds > 240000;
操作符
到目前为止,我们仅使用等于(=)或大于(>)运算符来创建条件。还有更多可供我们使用的东西。他们是不言自明的,只需要一些练习就可以下来。下表描述了最常用的运算符:
OPERATOR | DESCRIPTION |
---|---|
= | equal |
< | less than |
> | greater than |
<= | less than or equal |
>= | greater than or equal |
!= | not equal |
<> | not equal (yup, there are two ways) |
典型的使用方式如下:
SELECT * FROM tracks WHERE unit_price <= .99 AND milliseconds > 250000;
模糊检索
当您想匹配一个精确的字符串(例如 composer =‘Green Day’)时,您可以简单地使用等号(=)运算符。但是,该条件仅能完全匹配,因此只能匹配由 Green Day 独家创作的歌曲。如果我们想查找由“Green Day”组成的所有曲目(无论是单独还是与其他艺术家一起演奏),我们都需要能够匹配行列不等于“绿日”但包含“绿日”的行 在他们的某个地方。要对字符串的一部分进行条件匹配或在模式之后识别字符串,我们可以使用这些字符串模式匹配运算符之一。
OPERATOR | DESCRIPTION |
---|---|
LIKE | a string matches a pattern |
ILIKE | case insensitive version of LIKE |
SIMILAR TO | a string matches a regex pattern |
LIKE
Like 是将字符串匹配到模式的简单/轻巧的方法。模式是可以使用一些表示通配符的特殊符号的字符串。除了常规字符外,LIKE 可以使用的两个通配符是:
SYMBOL | DESCRIPTION |
---|---|
_ |
matches any single character |
% |
matches any number of characters |
为了制作与任何字符串内的“ Green Day”相匹配的模式,我们在两侧放置%符号,这意味着在 Green Day 之前或之后可以有任意数量的字符。因此,以这种模式为条件,在运行以下查询时,数据库将扫描每一行中的匹配项并返回正确的匹配项。
SELECT * FROM tracks WHERE composer LIKE '%Green Day%';
页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决;索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。
ILKIE
如果您希望模式不关心字符是大写还是小写,可以使用 ILIKE。I 代表“不区分大小写”。因此,如果我们想查找所有带有“ day”一词的作曲家,无论大小写,我们都可以使用:
SELECT * FROM tracks WHERE composer ILIKE '%day%';
'Little Richard' LIKE '%Richard' true
'Little Richard' LIKE '_______Richard' true
'Little Richard' LIKE '______Richard' false
'Little Richard' LIKE '%richard' false
'Little Richard' ILIKE '%richARD' true
'Little Richard' LIKE '_ittle %' true
SIMILAR TO
SIMILAR 是使用称为正则表达式(regexp)的标准模式格式将字符串与模式匹配的更高级方法。这些可以变得非常高级(对于本教程来说太高级了),因此我们将不对其进行详细介绍。但是,如果您想进一步研究,我们在这里提供了完整正则 PostgreSQL 表达式页面。
对于 SIMILAR TO 的快速示例,这是一个使用正则表达式的查询,以匹配由 AC / DC 或 Green Day 组成的所有轨道。
SELECT * FROM tracks WHERE composer SIMILAR TO '%(AC/DC|Green Day)%';
NULL 过滤
数据库中的空单元格称为 NULL。它们有些特殊的价值,处理方式也有所不同。您不能使用=或!=运算符,而是使用如图所示的 IS 运算符。
IS NULL -- matches NULL values
IS NOT NULL -- matches all non NULL values
expression IS NOT NULL
SELECT *
FROM contacts
WHERE last_name IS NOT NULL;
Case-When
Case 具有两种格式。简单 Case 函数和 Case 搜索函数。
CASE expression
WHEN condition1 THEN result1
WHEN condition2 THEN result2
...
WHEN conditionN THEN resultN
ELSE result
END as field_name
-- 简单Case函数
CASE sex
WHEN '1' THEN '男'
WHEN '2' THEN '女'
ELSE '其他' END
-- Case搜索函数
CASE WHEN sex = '1' THEN '男'
WHEN sex = '2' THEN '女'
ELSE '其他' END sex_description
这两种方式,可以实现相同的功能。简单 Case 函数的写法相对比较简洁,但是和 Case 搜索函数相比,功能方面会有些限制,比如写判断式。 还有一个需要注意的问题,Case 函数只返回第一个符合条件的值,剩下的 Case 部分将会被自动忽略。
--比如说,下面这段SQL,你永远无法得到“第二类”这个结果
CASE WHEN col_1 IN ( 'a', 'b') THEN '第一类'
WHEN col_1 IN ('a') THEN '第二类'
ELSE'其他' END
有如下数据:(为了看得更清楚,我并没有使用国家代码,而是直接用国家名作为 Primary Key)
国家(country) | 人口(population) |
---|---|
中国 | 600 |
美国 | 100 |
加拿大 | 100 |
英国 | 200 |
法国 | 300 |
日本 | 250 |
德国 | 200 |
墨西哥 | 50 |
印度 | 250 |
根据这个国家人口数据,统计亚洲和北美洲的人口数量。应该得到下面这个结果。
洲 | 人口 |
---|---|
亚洲 | 1100 |
北美洲 | 250 |
其他 | 700 |
想要解决这个问题,你会怎么做?生成一个带有洲 Code 的 View,是一个解决方法,但是这样很难动态的改变统计的方式。 如果使用 Case 函数,SQL 代码如下:
SELECT SUM(population),
CASE country
WHEN '中国' THEN '亚洲'
WHEN '印度' THEN '亚洲'
WHEN '日本' THEN '亚洲'
WHEN '美国' THEN '北美洲'
WHEN '加拿大' THEN '北美洲'
WHEN '墨西哥' THEN '北美洲'
ELSE '其他' END
FROM Table_A
GROUP BY CASE country
WHEN '中国' THEN '亚洲'
WHEN '印度' THEN '亚洲'
WHEN '日本' THEN '亚洲'
WHEN '美国' THEN '北美洲'
WHEN '加拿大' THEN '北美洲'
WHEN '墨西哥' THEN '北美洲'
ELSE '其他' END;
同样的,我们也可以用这个方法来判断工资的等级,并统计每一等级的人数。SQL 代码如下;
SELECT
CASE WHEN salary <= 500 THEN '1'
WHEN salary > 500 AND salary <= 600 THEN '2'
WHEN salary > 600 AND salary <= 800 THEN '3'
WHEN salary > 800 AND salary <= 1000 THEN '4'
ELSE NULL END salary_class,
COUNT(*)
FROM Table_A
GROUP BY
CASE WHEN salary <= 500 THEN '1'
WHEN salary > 500 AND salary <= 600 THEN '2'
WHEN salary > 600 AND salary <= 800 THEN '3'
WHEN salary > 800 AND salary <= 1000 THEN '4'
ELSE NULL END;
还可以用一个 SQL 语句完成不同条件的分组合并: 有如下数据
国家(country) | 性别(sex) | 人口(population) |
---|---|---|
中国 | 1 | 340 |
中国 | 2 | 260 |
美国 | 1 | 45 |
美国 | 2 | 55 |
加拿大 | 1 | 51 |
加拿大 | 2 | 49 |
英国 | 1 | 40 |
英国 | 2 | 60 |
按照国家和性别进行分组,得出结果如下
国家 | 男 | 女 |
---|---|---|
中国 | 340 | 260 |
美国 | 45 | 55 |
加拿大 | 51 | 49 |
英国 | 40 | 60 |
普通情况下,用 UNION 也可以实现用一条语句进行查询。但是那样增加消耗(两个 Select 部分),而且 SQL 语句会比较长。下面是一个是用 Case 函数来完成这个功能的例子
SELECT country,
SUM( CASE WHEN sex = '1' THEN
population ELSE 0 END), --男性人口
SUM( CASE WHEN sex = '2' THEN
population ELSE 0 END) --女性人口
FROM Table_A
GROUP BY country;
这样我们使用 Select,完成对二维表的输出形式,充分显示了 Case 函数的强大。