Top
  1. SQL(基础查询)
  2. SQL(关联查询)

1. SQL(基础查询)

1.1. 基本查询语句

1.1.1. FROM子句

SQL查询语句的语法如下:

SELECT <*, column [alias], …> FROM table;

其中:SELECT用于指定要查询的列,FROM指定要从哪个表中查询。如果要查询所有列,可以在SELECT后面使用*号,如果只查询特定的列,可以直接在SELECT后面指定列名,列名之间用逗号隔开。例句如下,查询dept表中的所有记录:

SELECT * FROM dept;

1.1.2. 使用别名

在SQL语句中可以通过使用列的别名改变标题的显示样式,或者表示计算结果的含义,使用语法是列的别名跟在列名后,中间可以加或不加一个“AS”关键字。例如:

SELECT empno AS id ,ename "Name", sal * 12 "Annual Salary"  FROM emp;

别名可以直接写,不必用双引号引起来。但是如果希望别名中区分大小写字符,或者别名中包含字符或空格,则必须用双引号引起来。

1.1.3. WHERE子句

在SELECT语句中,可以在WHERE子句中使用比较操作符限制查询结果,是可选的。

当查询条件中和数字比较,可以使用单引号引起,也可以不用,当和字符及日期类型的数据比较,则必须用单引号引起。例如查询部门10下的员工信息:

SELECT * FROM empWHERE deptno = 10;

查询职员表中职位是’SALESMAN’的职员:

SELECT ename, sal, job FROM emp WHERE job = 'SALESMAN';

图-1 用where子句定义查询条件

1.1.4. SELECT子句

如果只查询表的部分列,需要在SELECT后指定列名,例如:

SELECT empno, ename, sal, job FROM emp;

图-2查询指定的列

1.2. 查询条件

1.2.1. 使用>, <, >=, <=, !=, <>, =

在WHERE子句中的查询条件,可以使用比较运算符来做查询。比如:查询职员表中薪水低于2000元的职员信息:

SELECT ename, sal FROM emp WHERE sal< 2000;

查询职员表中不属于部门10的员工信息(!=等价于<>):

    SELECT ename, sal, job FROM emp WHERE deptno != 10;

查询职员表中在2002年1月1号以后入职的职员信息,比较日期类型数据:

   SELECT ename, sal, hiredate FROM emp
    WHERE hiredate>to_date('2002-1-1','YYYY-MM-DD');

1.2.2. 使用AND,OR关键字

在SQL操作中,如果希望返回的结果必须满足多个条件,应该使用AND逻辑操作符连接这些条件,如果希望返回的结果满足多个条件之一即可,应该使用OR逻辑操作符连接这些条件。例如:查询薪水大于1000并且职位是’CLERK’的职员信息:

SELECT ename, sal, job FROM emp
WHERE sal> 1000 AND job = 'CLERK';

查询薪水大于1000或者职位是’CLERK’的职员信息:

SELECT ename, sal, job FROM emp
WHERE sal> 1000 OR job = 'CLERK';

1.2.3. 使用LIKE条件(模糊查询)

当用户在执行查询时,不能完全确定某些信息的查询条件,或者只知道信息的一部分,可以借助LIKE来实现模糊查询。LIKE需要借助两个通配符:

这两个通配符可以配合使用,构造灵活的匹配条件。例如查询职员姓名中第二个字符是‘A’的员工信息:

SELECT ename, job FROM emp WHERE ename LIKE '_A%';

图-3 模糊查询的结果

1.2.4. 使用IN和NOT IN

在WHERE子句中可以用比较操作符IN(list)来取出符合列表范围中的数据。其中的参数list表示值列表,当列或表达式匹配于列表中的任何一个值时,条件为TRUE,该条记录则被显示出来。

IN页可以理解为一个范围比较操作符,只不过这个范围是一个指定的值列表,NOT IN(list) 取出不符合此列表中的数据记录。例如查询职位是MANAGER或者CLERK的员工:

SELECT ename, job FROM emp WHERE job IN ('MANAGER', 'CLERK');

查询不是部门10或20的员工:

SELECT ename, job FROM emp WHERE deptno NOT IN (10, 20);

1.2.5. BETWEEN…AND…

BETWEEN…AND…操作符用来查询符合某个值域范围条件的数据,最常见的是使用在数字类型的数据范围上,但对字符类型和日期类型数据也同样适用。例如查询薪水在1500-3000之间的职员信息:

    SELECT ename, sal FROM emp
    WHERE sal BETWEEN 1500 AND 3000;

1.2.6. 使用IS NULL和IS NOT NULL

空值NULL是一个特殊的值,比较的时候不能使用”=”号,必须使用IS NULL,否则不能得到正确的结果。例如查询哪些职员的奖金数据为NULL:

SELECT ename, sal, comm FROM emp
WHERE comm IS NULL;

1.2.7. 使用ANY和ALL条件

在比较运算符中,可以出现ALL和ANY,表示“全部”和“任一”,但是ALL和ANY不能单独使用,需要配合单行比较操作符>、>=、<、<=一起使用。其中:

例如,查询薪水比职位是“SALESMAN”的人高的员工信息,比任意一个SALESMAN高都行:

SELECT empno, ename, job, sal, deptno
FROM emp
WHERE sal> ANY (
SELECT sal FROM emp WHERE job = 'SALESMAN');

1.2.8. 查询条件中使用表达式和函数

当查询需要对选出的字段进行进一步计算,可以在数字列上使用算术表达式(+、-、*、/)。表达式符合四则运算的默认优先级,如果要改变优先级可以使用括号。

算术运算主要是针对数字类型的数据,对日期类型的数据可以做加减操作,表示在一个日期值上加或减一个天数。

查询条件中使用字符串函数UPPER,将条件中的字符串变大写后再参与比较:

SELECT ename, sal, job FROMempWHERE ename = UPPER('rose');

查询条件中使用算数表达式,查询年薪大于10w元的员工记录:

SELECT ename, sal, job FROM empWHERE sal * 12 >100000;

1.2.9. 使用DISTINCT过滤重复

数据表中有可能存储相同数据的行,当执行查询操作时,默认情况会显示所有行,不管查询结果是否有重复的数据。当重复数据没有实际意义,经常会需要去掉重复值,使用DISTINCT实现。例如查询员工的部门编码,包含所有重复值:

SELECT deptno FROM emp;

查询员工的部门编码,去掉重复值:

SELECT DISTINCT deptno FROM emp;

DISTINCT后面的列可以组合查询,下例查询每个部门的职位,去掉重复值。注意是deptno和job联合起来不重复:

SELECT DISTINCT deptno, job FROM emp;

图-4用distinct去掉重复的列

1.3. 排序

1.3.1. 使用ORDER BY字句

对查询出的数据按一定规则进行排序操作,使用ORDER BY子句。语法如下:

SELECT <*, column [alias], …>
FROM table 
[WHERE condition(s)] 
[ORDER BY column [ASC | DESC]] ;

注意,ORDER BY必须出现在SELECT中的最后一个子句。下例对职员表按薪水排序:

SELECT ename, sal
FROM emp
ORDER BY sal;

图-5用ORDER BY将查询结果排序

1.3.2. ASC和DESC

排序时默认按升序排列,即由小及大,ASC用来指定升序排序,DESC用来指定降序排序。

因为NULL值视作最大,则升序排列时,排在最后,降序排列时,排在最前。如果不写ASC或DESC,默认是ASC,升序排列。例如,按员工的经理升序排序:

    SELECT empno, ename, mgr FROM emp
    WHERE deptno = 10 ORDER BY mgr;

降序排列,必须指明,按员工的薪水倒序排序:

    SELECT ename, sal FROM emp
    ORDER BY sal DESC;

1.3.3. 多个列排序

当以多列作为排序标准时,首先按照第一列进行排序,如果第一列数据相同,再以第二列排序,以此类推。多列排序时,不管正序还是倒序,每个列需要单独设置排序方式。

下例对职员表中的职员排序,先按照部门编码正序排列,再按照薪水降序排列:

    SELECT ename, deptno, sal FROM emp
    ORDER BY deptno ASC, sal DESC;

1.4. 聚合函数

1.4.1. 什么是聚合函数

查询时需要做一些数据统计,比如:查询职员表中各部门职员的平均薪水,各部门的员工人数。当需要统计的数据并不能在职员表里直观列出,而是需要根据现有的数据计算得到结果,这种功能可以使用聚合函数来实现,即:将表的全部数据划分为几组数据,每组数据统计出一个结果。

因为是多行数据参与运算返回一行结果,也称作分组函数、多行函数、集合函数。用到的关键字:

1.4.2. MAX和MIN

用来取得列或表达式的最大、最小值,可以用来统计任何数据类型,包括数字、字符和日期。例如获取机构下的最高薪水和最低薪水,参数是数字:

SELECT MAX(sal) max_sal, MIN(sal) min_sal
FROM emp;

计算最早和最晚的入职时间,参数是日期:

SELECT MAX(hiredate) max_hire, MIN(hiredate) min_hire
FROM emp;

1.4.3. AVG和SUM

AVG和SUM函数用来统计列或表达式的平均值和和值,这两个函数只能操作数字类型,并忽略NULL值。例如获得机构下全部职员的平均薪水和薪水总和:

SELECT AVG(sal) avg_sal, SUM(sal)  sum_sal  FROM emp;

1.4.4. COUNT

COUNT函数用来计算表中的记录条数,同样忽略NULL值。例如获取职员表中一共有多少名职员记录:

    SELECT COUNT(*) total_num  FROM emp;

获得职员表中有多少人是有职位的(忽略没有职位的员工记录)

    SELECT COUNT(job) total_job  FROM emp;

1.4.5. 聚合函数对空值的处理

聚合函数忽略NULL值。即当emp表中的某列有NULL值,比如某新入职员工没有薪水,比较两条语句的结果:

SELECT AVG(sal)  avg_sal FROM emp;
SELECT AVG(NVL(sal,0)) avg_sal FROM emp;

1.5. 分组

1.5.1. GROUP BY子句

上面的例子都是以整个表作为一组。如果希望得到每个部门的平均薪水,而不是整个机构的平均薪水,需要把整个数据表按部门划分成一个个小组,每个小组中包含一行或多行数据,在每个小组中再使用分组函数进行计算,每组返回一个结果。语法如下:

SELECT <*, column [alias], …>
FROM table [WHERE condition(s)] 
[GROUP BY group_by_expression]
[HAVING group_condition]
[ORDER BY column [ASC | DESC]] ;

其中划分的小组有多少,最终的结果集行数就有多少。

1.5.2. 分组查询

图-6分组查询

1.5.3. HAVING字句

HAVING子句用来对分组后的结果进一步限制,比如按部门分组后,得到每个部门的最高薪水,可以继续限制输出结果。必须跟在GROUP BY后面,不能单独存在。例如查询每个部门的最高薪水,只有最高薪水大于4000的记录才被输出显示:

SELECT deptno, MAX(sal) max_sal FROM emp
GROUP BY deptno HAVING MAX(sal) >4000;

1.6. 查询语句的执行顺序

当一条查询语句中包含所有的子句,执行顺序依下列子句次序:

  1. FROM 子句:执行顺序为从后往前、从右到左。数据量较少的表尽量放在后面。
  2. WHERE子句:执行顺序为自下而上、从右到左。将能过滤掉最大数量记录的条件写在WHERE 子句的最右。
  3. GROUP BY:执行顺序从左往右分组,最好在GROUP BY前使用WHERE将不需要的记录在GROUP BY之前过滤掉。
  4. HAVING 子句:消耗资源。尽量避免使用,HAVING 会在检索出所有记录之后才对结果集进行过滤,需要排序等操作。
  5. SELECT子句:少用*号,尽量取字段名称。ORACLE 在解析的过程中, 通过查询数据字典将*号依次转换成所有的列名, 消耗时间。
  6. ORDER BY子句:执行顺序为从左到右排序,消耗资源。

2. SQL(关联查询)

2.1. 关联基础

2.1.1. 关联的概念

实际应用中所需要的数据,经常会需要查询两个或两个以上的表。这种查询两个或两个以上数据表或视图的查询叫做连接查询,连接查询通常建立在存在相互关系的父子表之间。语法如下:

SELECT table1.column, table2.column
FROM table1, table2
WHERE table1.column1 = table2.column2;

或者:

SELECT table1.column, table2.column
FROM table1JOIN table2
ON(table1.column1 = table2.column2);

2.1.2. 笛卡尔积

笛卡尔积指做关联操作的每个表的每一行都和其它表的每一行做组合,假设两个表的记录条数分别是X和Y,笛卡尔积将返回X * Y条记录。当两个表关联查询时,不写连接条件,得到的结果即是笛卡尔积。例如:

SELECT COUNT(*) FROM emp; --14条记录
SELECT COUNT(*) FROM dept; --4条记录
SELECT emp.ename, dept.dnameFROM emp, dept;--56条记录

2.1.3. 等值连接

等值连接是连接查询中最常见的一种,通常是在有主外键关联关系的表间建立,并将连接条件设定为有关系的列,使用等号”=”连接相关的表。例如查询职员的姓名、职位以及所在部门的名字和所在城市,使用两个相关的列做等值操作:

SELECT e.ename, e.job, d.dname, d.loc
FROM emp e, dept d
WHERE e.deptno = d.deptno;

2.2. 关联查询

2.2.1. 内连接

内连接返回两个关联表中所有满足连接条件的记录。例如查询员工的名字和所在部门的名字:

SELECT e.ename, d.dname
FROM emp e, dept d
WHERE e.deptno = d.deptno

上面的语法也可以写为:

SELECT e.ename, d.dname
FROM emp e JOIN dept d
ON(e.deptno = d.deptno);

2.2.2. 外连接

内连接返回两个表中所有满足连接条件的数据记录,在有些情况下,需要返回那些不满足连接条件的记录,需要使用外连接,即不仅返回满足连接条件的记录,还将返回不满足连接条件的记录。比如把没有职员的部门和没有部门的职员查出来。外连接的语法如下:

SELECT table1.column, table2.column
FROM table1 [LEFT | RIGHT | FULL] JOIN table2
ON table1.column1 = table2.column2;

了解驱动表的概念。

图-7左外连接

图-8右外连接

外连接查询的例子,Emp表做驱动表:

SELECT e.ename, d.dname
FROM emp e LEFT OUTER JOIN dept d
ON e.deptno = d.deptno;

Dept表做驱动表:

SELECT e.ename, d.dname
FROM emp e RIGHT OUTER JOIN dept d
ON e.deptno = d.deptno;

2.2.3. 全连接

全外连接是指除了返回两个表中满足连接条件的记录,还会返回不满足连接条件的所有其它行。即是左外连接和右外连接查询结果的总和。例如:

SELECT e.ename, d.dname
FROM emp e FULL OUTER JOIN dept d
ON e.deptno = d.deptno;

图-9 全外连接

2.2.4. 自连接

自连接是一种特殊的连接查询,数据的来源是一个表,即关联关系来自于单表中的多个列。表中的列参照同一个表中的其它列的情况称作自参照表。

自连接是通过将表用别名虚拟成两个表的方式实现,可以是等值或不等值连接。例如查出每个职员的经理名字,以及他们的职员编码:

SELECT worker.empnow_empno, worker.enamew_ename, manager.empnom_empno, manager.enamem_ename
FROM emp worker join emp manager
ON worker.mgr = manager.empno;