MySQL 分组排序后 → 如何取前N条或倒数N条

这篇具有很好参考价值的文章主要介绍了MySQL 分组排序后 → 如何取前N条或倒数N条。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

开心一刻

  晚上,老婆辅导女儿写语文作业

  填空题:春天来了,__绿了

  女儿:春天来了,爸爸绿了

  老婆一脸不悦地问道:你再说一遍,春天来了,什么玩意绿了?

  女儿:春天来了,爸爸绿了呀

  老婆很生气,但依旧温柔地问道:春天来了,爸爸怎么绿了呢

  女儿略带哭腔的说道:那冬天呢

  老婆急的直挠头:冬,冬,冬...,它跟天气有什么关系啊,那春天来了不应该是小草绿了吗

  女儿疑惑的左看右看,问道:那爸爸啥时候绿?

  老婆气的把笔一甩:我不知道你爸啥时候绿,你问你爸

  女儿转头看向我,问道:爸爸,你啥时候绿?

  我心里咯噔一下,这小棉袄有点漏风呀,小心翼翼的看了一眼老婆,坚定地说道:爸爸是不会绿的!

前情回顾

  前两天翻自己的博客的时候,翻到了:记一次有意思的 SQL 实现 → 分组后取每组的第一条记录

  突然意识到好像有续集没写

  翻到结尾,果然有个留疑

MySQL 分组排序后 → 如何取前N条或倒数N条

  但我要强调一点:这是我给你们的留疑,并不是我给你们的承诺!

  我没写续集,你们可不能生气,实在是生气,那你来打我呀!

MySQL 分组排序后 → 如何取前N条或倒数N条

  分组后取第一条记录

  我们先来简单回顾下实现方式

  1、循环查数据库

    逻辑很清晰,实现起来也很简单,但是会循环查数据库,开发规范一般会明确禁止这种写法

  2、 GROUP BY 结合 MySQL 函数 

     GROUP BY 之后,用 GROUP_CONCAT(log_id ORDER BY data_date DESC,modify_time DESC) 对 log_id 进行拼接

    然后用 SUBSTRING_INDEX 函数截取第一个 log_id 

    最后 INNER JOIN 

    但是, GROUP_CONCAT 有长度限制的问题,默认 1024 个字节( show variables like 'group_concat_max_len'; )

  3、新增最新记录表

    专门用一张表来记录任务最新执行成功记录

    表数据维护的逻辑:不存在则插入,存在则更新(记录不存在则插入,存在则更新 → MySQL 的实现方式有哪些?)

取前N条或倒数N条

  我们回到标题,分组排序后,如何取前N条记录或倒数N条记录

  循环查数据库

  1、先批量查询 task_id 

  2、再根据 task_id 逐个去查 t_task_exec_log ,排序获取前N条记录

  3、最后进行一个数据汇合,封装成页面需要的数据格式

  但这种方式会循环查数据库,一般是被禁止的

  GROUP BY 结合 MySQL 函数

  1、先批量查询 task_id 

  2、再根据这些 task_id 从 t_task_exec_log 批量查询每个任务的前N条记录的 log_id 集字符串

MySQL 分组排序后 → 如何取前N条或倒数N条MySQL 分组排序后 → 如何取前N条或倒数N条
SELECT task_id, SUBSTRING_INDEX(GROUP_CONCAT(log_id ORDER BY data_date DESC, modify_time DESC),',', 5) log_ids
FROM t_task_exec_log 
WHERE exec_status='success' AND task_id IN (124,156,158,200,300,358,500,800,1000,1001)
GROUP BY task_id;
View Code

MySQL 分组排序后 → 如何取前N条或倒数N条

   SUBSTRING_INDEX(str, delim, count) 不做过多介绍,具体可翻阅:SUBSTRING_INDEX

   count 参数可以用来实现前N条或倒数N条

  比如前 5 条: SUBSTRING_INDEX(GROUP_CONCAT(log_id ORDER BY data_date DESC, modify_time DESC),',', 5) 

MySQL 分组排序后 → 如何取前N条或倒数N条

  倒数 5 条: SUBSTRING_INDEX(GROUP_CONCAT(log_id ORDER BY data_date DESC, modify_time DESC),',', -5) 

MySQL 分组排序后 → 如何取前N条或倒数N条

  3、log_ids 按逗号(,)进行拆分得到 log_id 列表,然后根据 log_id 列表从 t_task_exec_log 批量查询

  4、最后进行数据汇合,封装成页面需要的数据格式

  但 GROUP_CONCAT 长度限制是需要考虑的点

  新增最新记录表

  这种方式比较契合只取第一条的情况,不适合取N条的情况

  N不固定,这张表的存储数据范围就不好确定

  如果为了全兼容的话,那这张表就成了 t_task_exec_log ,那就没意义了

  窗口函数

   MySQL8 新增的特性

  关于窗口函数可查阅官方文档:Window Functions,不做过多介绍

  我们用 ROW_NUMBER 来实现 取前N条或倒数N条 

  1、批量查询 task_id 

  2、使用 ROW_NUMBER ,取前N条或倒数N条

  取第一条

MySQL 分组排序后 → 如何取前N条或倒数N条

  结果如下

MySQL 分组排序后 → 如何取前N条或倒数N条

  取前 5 条

MySQL 分组排序后 → 如何取前N条或倒数N条MySQL 分组排序后 → 如何取前N条或倒数N条
SELECT * from (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY task_id ORDER BY data_date DESC, modify_time DESC) AS rn
    FROM t_task_exec_log 
    WHERE exec_status='success' 
    AND task_id IN (124,156,158,200,300,358,500,800,1000,1001)
) t WHERE rn <= 5;
View Code

MySQL 分组排序后 → 如何取前N条或倒数N条

  结果如下

MySQL 分组排序后 → 如何取前N条或倒数N条

  取倒数 5 条

MySQL 分组排序后 → 如何取前N条或倒数N条MySQL 分组排序后 → 如何取前N条或倒数N条
SELECT * from (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY task_id ORDER BY data_date ASC, modify_time ASC) AS rn
    FROM t_task_exec_log 
    WHERE exec_status='success' 
    AND task_id IN (124,156,158,200,300,358,500,800,1000,1001)
) t WHERE rn <= 5;
View Code

MySQL 分组排序后 → 如何取前N条或倒数N条

  结果如下

MySQL 分组排序后 → 如何取前N条或倒数N条

  留个疑问,利用窗口函数如何取倒数第一条?什么?写不出来?

MySQL 分组排序后 → 如何取前N条或倒数N条

  再看 GROUP BY 结合 MySQL 函数

  我们仔细看看 GROUP BY 结合 MySQL 函数 取倒数 5 条的结果

MySQL 分组排序后 → 如何取前N条或倒数N条

  我们发现和窗口函数的取倒数 5 条的结果不一致

  那到底是哪种方式不对,还是两种方式都不对?

  我们调整下 GROUP BY 结合 MySQL 函数 取倒数 5 条的写法

MySQL 分组排序后 → 如何取前N条或倒数N条MySQL 分组排序后 → 如何取前N条或倒数N条
SELECT task_id, SUBSTRING_INDEX(GROUP_CONCAT(log_id ORDER BY data_date ASC, modify_time ASC),',', 5) log_ids
FROM t_task_exec_log 
WHERE exec_status='success' AND task_id IN (124,156,158,200,300,358,500,800,1000,1001)
GROUP BY task_id;
View Code

MySQL 分组排序后 → 如何取前N条或倒数N条

  结果如下

MySQL 分组排序后 → 如何取前N条或倒数N条

  和窗口函数取倒数 5 条的结果一致了

  那之前的这种写法

MySQL 分组排序后 → 如何取前N条或倒数N条

  是哪里出了问题?

  我们先来看看如下 SQL 

MySQL 分组排序后 → 如何取前N条或倒数N条

  相信大家都能看懂,一共得到 374 条记录

MySQL 分组排序后 → 如何取前N条或倒数N条

  我们把 log_id 用逗号拼接起来,得到字符串

2911732,2859745,2499159,685756,611426,1773618,631452,2641408,862146,1652523,2655517,2829017,1273848,2804800,1346153,936083,326032,864980,2015739,2648288,1839113,1921285,1953625,453123,50498,2743528,2721333,2919955,372642,98491,1424351,411001,1482212,230620,1994696,2918589,729845,2694142,500264,1012517,2713357,2200896,974654,2717787,2457056,172360,2832664,2846066,1848934,1919788,732675,1950937,199880,452272,273194,1616674,1194494,574206,1765082,1689794,631552,2758932,2485780,1715193,459323,1455116,2115301,1233012,320608,2004650,291114,1244414,2924159,254791,1271023,2163511,1565143,2981613,1299572,320289,1732975,210406,1507432,638443,808796,1557188,181660,167930,2272885,1944188,262812,2023062,2462778,2123029,594954,190347,388515,2178560,1598418,2564269,1934342,2925082,1502641,1900920,684906,2154470,2046731,1703184,1291369,1176799,897154,1286441,2138541,358779,943677,2415429,785261,2051755,2038868,1217252,473186,2552463,928982,1151401,1925499,2808729,1921939,2119578,406768,1866953,180496,13656,2333480,2974079,510052,2605676,653081,1659249,1160006,445779,891431,1943934,2489901,2942196,1654209,2486759,2514795,2849804,2258416,1488416,1929865,1183551,2509115,2732442,2085668,155167,1404105,578027,647799,559332,242226,959127,1717819,1457281,2777656,61863,1558242,979673,1622502,2501716,1665362,532434,2753181,2234018,2707034,408087,1611263,534460,1894189,159376,60130,1191876,282199,517385,2858577,1784531,2030854,2314894,679800,809800,2875291,966557,1621580,1992525,2025266,831289,1817299,1927920,891559,2725289,1194667,1550104,332614,2806388,157145,1220399,240821,2063037,154538,359355,2278415,2630602,2902571,1777692,2196687,1350564,1148733,469669,2563548,1936924,2563736,2003906,877726,2292538,2859208,1204177,475146,489706,2378830,2648739,915623,1695372,924324,1256107,540292,1125327,2865163,2533333,2619710,286934,20214,709854,320888,2319692,707114,1191938,2072463,55703,1830338,500835,1807704,1072891,1667013,1112386,110901,1876567,1636858,112749,1492761,1658767,2801747,2958924,48303,1994737,2194535,2393165,671013,2033922,2885396,463995,2241443,990863,2002460,814506,2536522,2885553,2431339,2961562,1542264,243844,657825,1594584,1921044,1138212,2680904,160115,2792129,538559,1267940,2560155,736726,2703598,632802,789810,438915,1370898,1432282,2713566,365961,2606280,2212229,2657542,2937595,2627981,520690,1865823,429311,874447,920179,2931749,2747839,50134,2517467,2222347,2748625,1056689,1868505,487388,1879593,1607657,1160123,2125711,1755572,2387420,1414325,823557,1551361,820297,1127153,1637903,2917492,1120815,1431846,552906,309803,1077061,674581,2414226,1392681,249656,1669143,1981249,2662300,711478,1172051,2332973,714265,471843,2261154,584537,1758386,2711638,502326,714922,1135634,124863,1890229,2653580,1404021,2711808,1146362,1917812,264393,1666930,1442219,2010387,2193352,722880,1982728,475910,1372761,433962,2563593,1637767

  我们用 LENGTH 函数统计下该字符串长度

MySQL 分组排序后 → 如何取前N条或倒数N条

  一共 2853 个字节,而 GROUP_CONCAT 限制长度默认是 1024 字节

  我们用 SUBSTRING 函数对字符串截取前 1024 个字节

MySQL 分组排序后 → 如何取前N条或倒数N条

  得到字符串

2911732,2859745,2499159,685756,611426,1773618,631452,2641408,862146,1652523,2655517,2829017,1273848,2804800,1346153,936083,326032,864980,2015739,2648288,1839113,1921285,1953625,453123,50498,2743528,2721333,2919955,372642,98491,1424351,411001,1482212,230620,1994696,2918589,729845,2694142,500264,1012517,2713357,2200896,974654,2717787,2457056,172360,2832664,2846066,1848934,1919788,732675,1950937,199880,452272,273194,1616674,1194494,574206,1765082,1689794,631552,2758932,2485780,1715193,459323,1455116,2115301,1233012,320608,2004650,291114,1244414,2924159,254791,1271023,2163511,1565143,2981613,1299572,320289,1732975,210406,1507432,638443,808796,1557188,181660,167930,2272885,1944188,262812,2023062,2462778,2123029,594954,190347,388515,2178560,1598418,2564269,1934342,2925082,1502641,1900920,684906,2154470,2046731,1703184,1291369,1176799,897154,1286441,2138541,358779,943677,2415429,785261,2051755,2038868,1217252,473186,2552463,928982,1151401,1925499,2808729,1921939,2119578,406768,1866953,180496,13656,2333480,2974079,51

  我们再用 SUBSTRING_INDEX 对如上字符串进行操作

MySQL 分组排序后 → 如何取前N条或倒数N条

  是不是找到原因了?

MySQL 分组排序后 → 如何取前N条或倒数N条

  这种写法, GROUP_CONCAT 会先进行 1024 长度的截取,得到一个字符串

  然后 SUBSTRING_INDEX 再在该字符串基础上进行操作,这就导致了最终的结果错误!

总结

  1、MySQL 提供了很多函数,给使用者带来了很多便利,但我们要注意其限制

     GROUP_CONCAT 的默认长度 1024 

  2、窗口函数

    这是本文想引出的重点,是 MySQL8 的新特性

    窗口函数的特别之处在于,它可以将结果集中的每一行看作一个单独的计算对象,而不是将结果集划分为分组并计算每个分组的聚合值

     MySQL8 之前,分组之后只能做聚合操作,不能对组中的每条记录进行单独操作

     MySQL8 及其之后,打破了分组之后只能聚合操作的限制,大大方便了我们实现某些特殊场景

     ROW_NUMBER 只是窗口函数之一, MySQL 还提供了其他的窗口函数,建议大家都去了解下

    某些聚合函数加上 OVER 子句后就变成窗口函数了,实现效果很有意思,推荐大家去好好阅读官方文档文章来源地址https://www.toymoban.com/news/detail-750421.html

到了这里,关于MySQL 分组排序后 → 如何取前N条或倒数N条的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MySQL 实现row_number() over(partition by ) 分组排序功能

    语法格式:   row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where 、group by,但不晚于 order by 的执行。   创建测试环境 在线数据库 http://sqlfiddle.com/   1. 创建表   2. Oracle row_number() over(partition by) 分组排序功能   3. M

    2024年02月15日
    浏览(41)
  • 【JaveWeb教程】(20) MySQL数据库开发之 基本查询、条件查询、聚合函数、分组查询、排序查询、分页查询 详细代码示例讲解

    在上次学习的内容中,我们讲解了: 使用DDL语句来操作数据库以及表结构(数据库设计) 使用DML语句来完成数据库中数据的增、删、改操作(数据库操作) 我们今天还是继续学习数据库操作方面的内容:查询(DQL语句)。 查询操作我们分为两部分学习: DQL语句-单表操作

    2024年02月02日
    浏览(85)
  • 【MySQL】不允许你不了解如何分组数据

    🎬 博客主页:博主链接 🎥 本文由 M malloc 原创,首发于 CSDN🙉 🎄 学习专栏推荐:LeetCode刷题集! 🏅 欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📆 未来很长,值得我们全力奔赴更美好的生活✨ 😁大家好呀,今天是我第N次写MySQL,也是最近才学习MySQL,也想着记录

    2024年02月12日
    浏览(39)
  • Mysql 如何分组查询取最新的几种方案

    示例: SELECT * FROM ( SELECT *, row_number ( ) over ( PARTITION BY 分组字段 ORDER BY 排序字段 DESC ) AS rn FROM 表 ) pca WHERE pca.rn = 1 解释: 1. rn字段:返回的是分组内的结果排序依次递增 2. 分组字段:进行分组的字段 3. 排序字段:需要取最新逻辑的字段 注意: row_number函数得到的字段rn不能

    2024年02月06日
    浏览(38)
  • Elasticsearch:倒数排序融合 - Reciprocal rank fusion

    注意 :RRF 在 Elastic Stack 8.8 中正式提供。 倒数排序融合(RRF)是一种将具有不同相关性指标的多个结果集组合成单个结果集的方法。 RRF 无需调优,不同的相关性指标也不必相互关联即可获得高质量的结果。该方法的优势在于不利用相关分数,而仅靠排名计算。相关分数存在

    2024年02月08日
    浏览(38)
  • Mysql 数据库DQL 数据查询语言 SELECT 基本查询、条件查询、聚合查询、分组查询、排序查询、分页查询——包含DQL所有查询语句。吐血分享。

    DQL:数据查询语言; 用来对表内的数据进行查找 。Database Query Language SQL语句分为:基本查询、条件查询、聚合查询、分组查询、排序查询、分页查询。  可以发现name字段就只剩下一个张三了;   条件: 条件查询—比较运算符 比较运算符 功能 大于 = 大于等于 小于 = 小于等

    2024年01月19日
    浏览(56)
  • Elasticsearch:倒数排序融合 - Reciprocal rank fusion (RRF)

    注意 :RRF 在 Elastic Stack 8.8 中正式提供。 倒数排序融合(RRF)是一种将具有不同相关性指标的多个结果集组合成单个结果集的方法。 RRF 无需调优,不同的相关性指标也不必相互关联即可获得高质量的结果。该方法的优势在于不利用相关分数,而仅靠排名计算。相关分数存在

    2024年02月13日
    浏览(40)
  • MySQL如何查询根据某一条件分组,再查询出每组数据中时间最早或最晚的数据

    最近遇到个需求,需要先根据A条件进行分组,然后查询出每组数据中时间最近的一条数据,立马就写出了sql语句 但是执行了一下,发现不对,子查询中 order by 貌似失效了,查出来的数据并不是要想要的时间最近的数据。 经过我的研究,发现,想要子查询中使用order by生效,

    2024年03月09日
    浏览(49)
  • excel 分组排序

    excel中会遇到对不同分组数据进行排序,比如对于不同班级里的学生按照分数高低进行升序排序,可以采用如下公式 如果需要 进行降序排序,将公式中的大于号替换为小于号即可

    2024年02月10日
    浏览(34)
  • Excel分组排序

    公式:「=SUMPRODUCT((A$2:A$12=A2)*(C$2:C$12C2))+1」。加1是因为大于当前值的个数加1正好就是当前值的排名。 A2:A12分组列,C2:C12排序值列 啰嗦: 教导主任给了我这次全校学生的期中考试成绩表,让我把每位同学所在班级排名名次以及在全校排名名次都列出来。 有个比较特别的函数

    2024年02月10日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包