MySQL数据库(4)----生成统计信息

时间:2023-03-09 22:02:40
MySQL数据库(4)----生成统计信息

  MySQL最有用的一项功能就是,能够对大量原始数据进行归纳统计。

1.在一组值里把各个唯一的值找出来,这是一项典型的统计工作,可以使用DISTINCT 关键字清楚查询结果里重复出现的行。例如,下面的查询可以查看 student 表里所有的性别:

mysql> SELECT DISTINCT sex FROM student;
+-----+
| sex |
+-----+
| M |
| F |
+-----+
rows in set (0.00 sec)

2. 另一种统计形式是计数,需要使用COUNT()函数。如果使用 COUNT(*),那么计算出来的结果将是查询所选取到的行数。如果查询语句没有带 WHERE 子句,那么它会查询所有行,因此,COUNT(*) 计算出来的结果就是表的行数。

(i)下面这个查询可以显示出 student 表里有多少行:

mysql> SELECT COUNT(*) FROM student;
+----------+
| COUNT(*) |
+----------+
| |
+----------+
row in set (0.00 sec)

(ii)下面这个查询可以查看 student 表里有多少不同的性别:

mysql> SELECT COUNT(DISTINCT sex) FROM student;
+---------------------+
| COUNT(DISTINCT sex) |
+---------------------+
| |
+---------------------+
row in set (0.00 sec)

(iii)如果查询语句带有 WHERE 子句,那么COUNT(*) 计算出来的结果就是该语句匹配到了多少行。下面这个查询可以显示出 student 表中有多少 Female:

mysql> SELECT COUNT(*) FROM student WHERE sex='F';
+----------+
| COUNT(*) |
+----------+
| |
+----------+
row in set (0.00 sec)

(iv)COUNT(*) 函数会统计所有被查询到的行数,与之相对的是,COUNT(列名)只会统计所有非NULL值的数目。下面这个查询展示了这两个函数的区别:

mysql> SELECT COUNT(DISTINCT sex) ,COUNT(name),COUNT(student_id) FROM student;
+---------------------+-------------+-------------------+
| COUNT(DISTINCT sex) | COUNT(name) | COUNT(student_id) |
+---------------------+-------------+-------------------+
| | | |
+---------------------+-------------+-------------------+
row in set (0.00 sec)

(v)另外,还可以使用 GROUP BY 语句分别统计男、女学生的人数:

mysql> SELECT sex , COUNT(*) FROM student GROUP BY sex;
+-----+----------+
| sex | COUNT(*) |
+-----+----------+
| F | |
| M | |
+-----+----------+
rows in set (0.00 sec)

(vi) 如果不是想用LIMIT子句来限制查询结果中的记录条数,而是想把COUNT() 的某些特定值找出来,那么需要用到HAVING子句。该子句与WHERE相类似,他们都可以用来设定输出行所必须满足的查询条件。与WHERE子句不同的是,它可以引用像COUNT()那样的汇总函数输出的结果。下面的查询显示了 student 表中个数超过3个的那种性别:

mysql> SELECT sex,COUNT(*) AS count FROM student
-> GROUP BY sex HAVING count> ORDER BY count DESC;
+-----+-------+
| sex | count |
+-----+-------+
| M | |
+-----+-------+
row in set (0.00 sec)

一般情况下,带有HAVING子句的查询语句,特别适合于查找在某个数据列里重复出现的值。也可以用于查找不重复出现的值,此时使用 HAVING count=1 即可。

  

(vii)  除了 COUNT() 外,还有其他几个汇总函数,函数 MIN()、MAX()、SUM()和 AVG() 可分别用于确定某个数据列的最小值、最大值、总计和平均值。甚至可以在同一个查询语句里使用它们。下面这个查询可以显示了这几个函数的用法:

mysql> SELECT
-> MIN(student_id) as minimum,
-> MAX(student_id) as maximum,
-> MAX(student_id)- MIN(student_id) + as span,
-> SUM(student_id) as total,
-> AVG(student_id) as average,
-> COUNT(student_id) as count
-> FROM student;
+---------+---------+------+-------+---------+-------+
| minimum | maximum | span | total | average | count |
+---------+---------+------+-------+---------+-------+
| | | | | 3.5000 | |
+---------+---------+------+-------+---------+-------+
row in set (0.00 sec)

(viii) 如果想要生成额外的输出行,显示出"统计结果的统计",那么还需要增加一条 WITH ROLLUP 子句。它会让 MySQL 计算各分组行的“超集”值。如下实例:

mysql> SELECT sex , count(*) as count FROM student GROUP BY sex WITH ROLLUP;
+-----+-------+
| sex | count |
+-----+-------+
| F | |
| M | |
| NULL | |
+-----+-------+
rows in set (0.00 sec)

分组列里的NULL表明,相应的计数结果就是其前面那些分组统计的汇总值。