
在数据分析和报表生成中,我们经常需要从数据库中提取聚合信息,例如某个类别的总数、最大值或最小值。更进一步,有时还需要在这些总数的基础上,计算满足特定条件的子集数量。本教程将通过一个具体场景,演示如何在sql查询中同时实现总数统计和条件计数。
假设我们有一个员工考勤系统,其中包含employees表和callouts(出勤记录)表。employees表存储员工信息,callouts表记录了员工的每一次出勤或缺勤。callouts表中有一个EXCUSED列,用0表示请假(excused),1表示未请假(unexcused)。我们的目标是查询每个司机的总出勤/缺勤次数,并在此基础上,额外统计他们的未请假次数。
首先,我们有一个基础查询,用于统计每个司机的总出勤/缺勤次数以及最近一次记录的日期:
SELECT
e.driver,
c.id, -- 注意:这里c.id在GROUP BY中可能不是预期的,通常我们会选择聚合函数如MAX(c.id)或移除
MAX(c.date) AS latest_date,
COUNT(*) AS total_instances
FROM
employees AS e
JOIN
callouts AS c ON e.id = c.id
WHERE
e.status = 0 -- 假设status = 0表示在职员工
GROUP BY
e.driver
ORDER BY
e.driver;这个查询通过employees和callouts表进行连接,筛选出状态为0的员工,然后按driver分组,计算每个司机的总记录数 (COUNT(*)) 和最近的记录日期 (MAX(c.date))。c.id列在这里直接选择,但由于GROUP BY e.driver,c.id的值将是不确定的(取决于数据库的实现,可能会是该组中的任意一个c.id),在实际应用中,通常会对其应用聚合函数(如MIN(c.id)或MAX(c.id))或者如果不是聚合键则不直接选择。
假设上述查询的结果如下:
| DRIVER | ID | LATEST_DATE | TOTAL_INSTANCES |
|---|---|---|---|
| BILL | 2 | 2021-11-09 | 9 |
| FRED | 8 | 2021-11-01 | 6 |
| TOM | 4 | 2021-11-03 | 3 |
现在,我们需要在此基础上增加一列,显示每个司机的未请假次数。callouts表中的EXCUSED列是一个关键,1代表未请假,0代表请假。
由于EXCUSED列的值是0或1,我们可以巧妙地利用SUM()聚合函数来实现条件计数。当对一个包含0和1的列求和时,其结果就是1的出现次数。因此,SUM(c.excused)将直接给出未请假(EXCUSED = 1)的总次数。
将这个条件计数逻辑整合到原有的查询中,得到以下优化后的SQL:
SELECT
e.driver,
MAX(c.id) AS example_callout_id, -- 修正c.id的用法,使用聚合函数
MAX(c.date) AS latest_date,
COUNT(*) AS total_instances,
SUM(c.excused) AS unexcused_absences -- 新增:计算未请假次数
FROM
employees AS e
JOIN
callouts AS c ON e.id = c.id
WHERE
e.status = 0
GROUP BY
e.driver
ORDER BY
e.driver;在这个修改后的查询中:
执行上述查询后,结果将包含新增的unexcused_absences列:
| DRIVER | EXAMPLE_CALLOUT_ID | LATEST_DATE | TOTAL_INSTANCES | UNEXCUSED_ABSENCES |
|---|---|---|---|---|
| BILL | 2 | 2021-11-09 | 9 | 5 |
| FRED | 8 | 2021-11-01 | 6 | 3 |
| TOM | 4 | 2021-11-03 | 3 | 1 |
(注:UNEXCUSED_ABSENCES列的值是示例数据,实际值将根据数据库中的EXCUSED列数据计算得出。)
SUM(CASE WHEN c.excused = 'NO' THEN 1 ELSE 0 END) AS unexcused_absences
这种CASE表达式的方法更为通用,适用于各种复杂的条件判断。
通过本教程,我们学习了如何在SQL查询中结合GROUP BY子句,利用SUM()函数对0/1标志列进行条件计数,从而在一次查询中同时获取总数和满足特定条件的子集数量。这种技术在数据分析和报表生成中非常实用,能够帮助我们更高效地从原始数据中提取有价值的信息。理解并灵活运用SUM()与CASE表达式进行条件聚合,是SQL数据处理中一项重要的技能。
以上就是SQL 查询中的条件聚合与总计计算的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号