MySQL修炼手册4:分组与聚合:GROUP BY与HAVING的应用

这篇具有很好参考价值的文章主要介绍了MySQL修炼手册4:分组与聚合:GROUP BY与HAVING的应用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

写在开头

MySQL数据库的强大功能为我们提供了丰富的数据处理工具,其中GROUP BY与HAVING的应用使得数据的分组与聚合变得更加灵活和高效。在本篇博客中,我们将深入研究GROUP BY与HAVING的基础知识,并通过实际案例,展示它们在数据分析中的强大威力。

创建水果销售表

首先,为了更好地演示GROUP BY与HAVING的应用,我们创建了一个水果销售表fruit_sales,包含字段:id(销售记录ID)、fruit_name(水果名称)、sales_year(销售年份)、sales_quantity(销售量)、sales_revenue(销售额)。下面是一些示例数据:

CREATE TABLE fruit_sales (
    id INT PRIMARY KEY,
    fruit_name VARCHAR(50),
    sales_year INT,
    sales_quantity INT,
    sales_revenue DECIMAL(10, 2)
);

INSERT INTO fruit_sales (id, fruit_name, sales_year, sales_quantity, sales_revenue) VALUES
(1, 'Apple', 2022, 100, 150.00),
(2, 'Orange', 2022, 120, 180.00),
(3, 'Banana', 2022, 80, 90.00),
(4, 'Apple', 2023, 150, 225.00),
(5, 'Orange', 2023, 90, 108.00),
(6, 'Banana', 2023, 120, 144.00),
(7, 'Apple', 2024, 80, 120.00),
(8, 'Orange', 2024, 110, 132.00),
(9, 'Banana', 2024, 100, 120.00);

运行下面语句,查询所有数据。

SELECT
	* 
FROM
	fruit_sales;

查询所有数据:
MySQL修炼手册4:分组与聚合:GROUP BY与HAVING的应用,数据库,mysql,android,数据库,sql

1 GROUP BY子句基础

1.1 基本的GROUP BY语法

GROUP BY子句是MySQL中用于对结果进行分组的关键。通过以下语法,我们可以按照指定列的值将结果分组:

SELECT fruit_name
FROM fruit_sales
GROUP BY fruit_name;

1.2 在SELECT中使用聚合函数

与GROUP BY结合使用聚合函数,可以对每个分组进行更详细的统计分析:

SELECT
	fruit_name,
	AVG( sales_quantity ) AS avg_quantity,
	SUM( sales_revenue ) AS total_revenue 
FROM
	fruit_sales 
GROUP BY
	fruit_name;

2 常见聚合函数

2.1 COUNT函数:统计行数

COUNT函数用于统计指定列中的行数,适用于对数据集大小进行直观认识。在这里介绍三种常见的写法:
写法1:count(字段)

SELECT COUNT(id) AS total_sales

写法2:count(1)

SELECT COUNT(1) AS total_sales

写法3:count(*)

SELECT COUNT(*) AS total_sales

2.2 SUM函数:求和

通过SUM函数,我们可以计算某一列的总和,比如计算水果的总销售额:

SELECT
	SUM( sales_revenue ) AS total_revenue 
FROM
	fruit_sales;

2.3 AVG函数:求平均值

AVG函数用于计算某一列的平均值,例如计算水果的平均销售数量:

SELECT
	AVG( sales_quantity ) AS avg_quantity 
FROM
	fruit_sales;

2.4 其他常见函数

MAX(): 用于获取某列的最大值。

SELECT MAX(sales_quantity) FROM fruit_sales;

MIN(): 用于获取某列的最小值。

SELECT MIN(sales_quantity) FROM fruit_sales;

GROUP_CONCAT(): 用于将组内的值连接成字符串。

SELECT
	GROUP_CONCAT( fruit_name ) fruits_category
FROM
	fruit_sales 
GROUP BY
	sales_year;

STD() 和 STDDEV(): 分别用于计算总体标准差和样本标准差。

SELECT
	std( sales_quantity ) sales_quantity_std
FROM
	fruit_sales;
	
	SELECT
	stddev( sales_quantity ) sales_quantity_stddev
FROM
	fruit_sales;

VAR_POP() 和 VAR_SAMP(): 分别用于计算总体方差和样本方差。

SELECT
	var_pop( sales_quantity ) sales_quantity_var
FROM
	fruit_sales;
	
SELECT
	var_samp( sales_quantity ) sales_quantity_varsamp
FROM
	fruit_sales;

3 GROUP BY子句的应用

在MySQL中,GROUP BY子句是进行分组操作的关键工具,它允许我们按照指定的列对结果进行分类,从而进行更加细致的数据分析。接下来,我们将深入研究GROUP BY子句的不同应用场景,并列举一些实际的例子。

3.1 对结果进行分组

基本的GROUP BY语法已经在前文中介绍过,这里我们来看一些更具体的例子。

3.1.1 按照年份分组统计水果销售量

SELECT sales_year, SUM(sales_quantity) AS total_quantity
FROM fruit_sales
GROUP BY sales_year;

这个查询会将销售表按照年份分组,计算每年的总销售量。

3.1.2 按照水果种类和年份分组统计销售额

SELECT fruit_name, sales_year, SUM(sales_revenue) AS total_revenue
FROM fruit_sales
GROUP BY fruit_name, sales_year;

这个查询将销售表按照水果种类和年份两个维度进行分组,计算每种水果每年的总销售额。

3.2 稍微复杂一些的聚合

结合GROUP BY和聚合函数,我们可以在分组的基础上对每个分组进行各种统计操作,以下是一些示例。

3.2.1 计算每年平均销售量和总销售额

SELECT sales_year, AVG(sales_quantity) AS avg_quantity, SUM(sales_revenue) AS total_revenue
FROM fruit_sales
GROUP BY sales_year;

这个查询会计算每年的平均销售量和总销售额。

3.2.2 查找每种水果的最大销售量和最小销售额

SELECT fruit_name, MAX(sales_quantity) AS max_quantity, MIN(sales_revenue) AS min_revenue
FROM fruit_sales
GROUP BY fruit_name;

这个查询会找出每种水果的最大销售量和最小销售额。

4 聚合函数的条件运用

在实际的数据分析过程中,经常需要根据特定条件对数据进行聚合分析。聚合函数的条件运用主要通过在聚合函数内部结合使用WHERE子句和HAVING子句来实现,让我们深入探讨各种应用场景。

4.1 示例:统计每个水果在销售年份为2023年的销售量

SELECT fruit_name, SUM(sales_quantity) AS total_quantity
FROM fruit_sales
WHERE sales_year = 2023
GROUP BY fruit_name;

在这个例子中,WHERE子句用于筛选出销售年份为2023年的数据,然后通过SUM函数计算每个水果的总销售量。

4.2 示例:计算销售额超过100的水果的平均销售量

SELECT fruit_name, AVG(sales_quantity) AS avg_quantity
FROM fruit_sales
WHERE sales_revenue > 100
GROUP BY fruit_name;

在这个例子中,WHERE子句用于筛选出销售额超过100的数据,然后通过AVG函数计算每个水果的平均销售量。

5 HAVING子句的应用

在MySQL中,HAVING子句通常用于对GROUP BY的结果进行条件过滤。它在很大程度上类似于WHERE子句,但WHERE用于过滤行,而HAVING用于过滤组。下面我们将详细展开HAVING的应用,并列举一些实际场景中的使用案例。

5.1 在GROUP BY的基础上使用HAVING

当我们通过GROUP BY对数据进行分组后,有时候希望进一步筛选出符合特定条件的组,这时就需要使用HAVING子句。以下是一个简单的例子:

SELECT sales_year, fruit_name, AVG(sales_quantity) AS avg_quantity
FROM fruit_sales
GROUP BY sales_year, fruit_name
HAVING avg_quantity > 100;

在这个例子中,我们首先按年份和水果名称对数据进行了分组,然后使用HAVING筛选出平均销售数量超过100的组。

5.2 HAVING与聚合函数的进一步结合

HAVING经常与聚合函数一起使用,以便更精细地过滤分组。以下是一个例子,我们想找出销售额最高的水果,但只考虑那些销售额总和超过500的水果:

SELECT fruit_name, SUM(sales_revenue) AS total_revenue
FROM fruit_sales
GROUP BY fruit_name
HAVING total_revenue > 500;

这个查询首先按水果名称分组,然后计算每个组的销售额总和,最后通过HAVING过滤出总销售额超过500的水果。

5.3 多条件的HAVING过滤

HAVING也可以使用多个条件进行过滤,从而更灵活地满足复杂的查询需求。例如,我们想找出在2023年和2024年都有销售记录的水果:

SELECT fruit_name, COUNT(DISTINCT sales_year) AS years_with_sales
FROM fruit_sales
GROUP BY fruit_name
HAVING years_with_sales = 2;

这个查询中,我们首先按水果名称分组,然后使用COUNT(DISTINCT sales_year)计算每个组中不同年份的销售记录数量,最后通过HAVING过滤出年份数量为2的水果,即在2023年和2024年都有销售记录的水果。

5.4 HAVING与其他条件的结合

在实际应用中,HAVING通常与其他条件一起使用,以进一步精炼查询结果。例如,我们想找出在2022年以后有销售记录的水果中,销售额总和超过200的水果:

SELECT fruit_name, SUM(sales_revenue) AS total_revenue
FROM fruit_sales
WHERE sales_year >= 2022
GROUP BY fruit_name
HAVING total_revenue > 200;

这个查询中,我们首先使用WHERE条件筛选出销售年份在2022年及以后的数据,然后按水果名称分组,并通过HAVING进一步过滤出销售额总和超过200的水果。

5.5 HAVING与聚合函数的嵌套

在某些情况下,我们可能需要对聚合函数的结果再次进行聚合,这时HAVING与聚合函数的嵌套就派上用场了。例如,我们想找出每个水果销售量的平均值超过所有水果平均销售量的水果:

SELECT fruit_name, AVG(sales_quantity) AS avg_quantity
FROM fruit_sales
GROUP BY fruit_name
HAVING avg_quantity > (SELECT AVG(sales_quantity) FROM fruit_sales);

这个查询中,我们首先按水果名称分组,计算每个组的销售量平均值,然后通过HAVING子句筛选出平均销售量超过所有水果平均销售量的水果。

6 GROUP BY与多表查询的结合使用

在实际的数据库应用中,数据通常存储在多个表中,因此对这些表进行联合查询并进行适当的分组是非常普遍的操作。GROUP BY与多表查询的结合使用能够为我们提供更深入的数据分析和统计能力。

6.1 使用GROUP BY对多表进行分组

在涉及多表查询时,GROUP BY可以帮助我们对结果进行更有意义的分组。考虑以下示例,我们有一个水果销售表fruit_sales和一个水果类别表fruit_categories

CREATE TABLE fruit_categories (
    id INT PRIMARY KEY,
    fruit_name VARCHAR(50),
    category VARCHAR(50)
);



INSERT INTO fruit_categories (id, fruit_name, category) VALUES
(1, 'Apple', 'hard'),
(2, 'Orange', 'soft'),
(3, 'Banana', 'soft');

现在,我们想要按照水果类别进行销售量的统计,可以使用如下查询:

SELECT
	fc.category,
	SUM( fs.sales_quantity ) AS total_quantity 
FROM
	fruit_sales fs
	JOIN fruit_categories fc ON fs.fruit_name = fc.fruit_name 
GROUP BY
	fc.category;

这个查询将fruit_salesfruit_categories两个表联合起来,按照水果类别进行分组,然后计算每个类别的总销售量。这对于分析不同类别水果的整体销售表现非常有帮助。

6.2 GROUP BY与JOIN操作的协同应用

在多表查询中,JOIN操作和GROUP BY可以协同使用,为我们提供更为复杂的数据统计和分析。考虑以下场景,我们要找出每个水果类别的平均销售额:

SELECT
	fc.category,
	AVG( fs.sales_revenue ) AS avg_revenue 
FROM
	fruit_sales fs
	JOIN fruit_categories fc ON fs.fruit_name = fc.fruit_name 
GROUP BY
	fc.category;

这个查询首先通过JOIN将fruit_salesfruit_categories两个表关联,然后按照水果类别进行分组,最后计算每个类别的平均销售额。这样的查询可以为市场策略制定、库存管理等方面提供重要的数据支持。

写在最后

通过本篇MySQL修炼手册,我们深入研究了GROUP BY与HAVING的应用,以及它们在不同场景下的运用技巧。掌握这些知识,将使我们在实际应用中更加游刃有余地处理复杂的数据分析与统计任务。在下一篇手册中,我们将继续拓展MySQL的强大功能,探讨更多高级查询与优化技巧,为数据库操作的深入理解打下坚实基础。文章来源地址https://www.toymoban.com/news/detail-791277.html

到了这里,关于MySQL修炼手册4:分组与聚合:GROUP BY与HAVING的应用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ES聚合分页(group by分组后分页)

    案例:统计业务应用流量数据

    2024年02月11日
    浏览(44)
  • MySQL查询分组Group By原理分析

    日常开发中,我们经常会使用到group by: 你是否知道group by的工作原理呢? group by和having有什么区别呢? group by的优化思路是怎样的呢? 使用group by有哪些需要注意的问题呢? 使用group by的简单例子 group by 工作原理 group by + where 和 having的区别 group by 优化思路 group by 使用注意

    2023年04月16日
    浏览(30)
  • GROUP BY和HAVING用法介绍

    一、group by用法 “group by”就是对数据进行分组,然后针对分组后的数据进行处理。 如: 返回结果实际上就是根据C进行分类汇总。 二、group by 和 having 1、having必须和group by一起用,且在group by后面,但是group可以单独用来分组 2、group by、having、order by的使用顺序:group by 、

    2024年02月15日
    浏览(25)
  • 【MySQL】MySQL表的增删查改以及聚合函数/group by句子的使用

    语法: 插入两条记录,value_list 数量必须和定义表的列的数量及顺序一致 注意,这里在插入的时候,也可以不用指定id(当然,那时候就需要明确插入数据到那些列了),那么mysql会使用默认的值进行自增。 插入两条记录,value_list 数量必须和指定列数量及顺序一致 由于 主键

    2024年01月19日
    浏览(39)
  • 【ABAP】OPEN SQL(七)「GROUP BY | HAVING | ORDER BY」

    💂 作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后端的开发语言ABAP,SQL进行任务的完成,对SAP企业管理系统,SAP ABAP开发和数据库具有较

    2024年02月08日
    浏览(45)
  • SQL group by、where和having语句用法

    SQL 语句中的 GROUP BY 子句用于将具有相同值的行分组在一起,通常与聚合函数(如 COUNT、SUM、AVG 等)一起使用。WHERE 子句用于筛选符合条件的行。HAVING 子句则在分组后对分组结果进行进一步筛选。 以下是一个使用 SQL 语句中的 GROUP BY、WHERE 和 HAVING 子句的示例: 在这个示例中

    2024年02月07日
    浏览(46)
  • mysql通过group by分组取最大时间对应的数据,提供两种有效方法。

    1、项目记录表project_record的结构和数据如下: 以下为项目记录表 project_record 的所有数据。project_id为项目Id,on_project_time为上项目时间。(每一条数据代表着上某个项目(project_id)的时间(on_project_time)记录) 2、我们的需求是:取出每个项目中最大上项目时间对应的那条数据。

    2023年04月08日
    浏览(31)
  • SQL HAVING 子句详解:在 GROUP BY 中更灵活的条件筛选

    HAVING 子句被添加到SQL中,因为 WHERE 不能与聚合函数一起使用。 HAVING语法 以下是Northwind示例数据库中“Customers”表的一部分选择: CustomerID CustomerName ContactName Address City PostalCode Country 1 Alfreds Futterkiste Maria Anders Obere Str. 57 Berlin 12209 Germany 2 Ana Trujillo Emparedados y helados Ana

    2024年02月05日
    浏览(51)
  • MySQL使用GROUP BY分组后,获取每组中时间记录最新的行对应的其他字段

    在编写MySQL数据库查询语句时,经常遇到使用GROUP BY分组后,需要获取每组中时间记录最新的行对应的其他字段这一情况。例如下表(t_score): id student course score examdate 1 小张 语文 89.0 2023-06-29 2 小张 数学 90.0 2023-06-29 3 小张 语文 91.0 2024-01-10 4 小张 数学 93.0 2024-01-10 5 小李 语

    2024年01月17日
    浏览(28)
  • 聚合函数+group by

    常用的聚合函数有COUNT()、AVG()、SUM()、MAX()、MIN()。 COUNT()函数:统计数据表中包含的记录行的总数,或者根据查询结果返回列中包含的数据行数。 COUNT(*)计算表中总的行数,不管某列是否有数值或者为空值。 COUNT(字段名)计算指定列下总的行数,计算时将忽略空值的行。 对于

    2024年02月02日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包