mysql执行顺序与索引算法

这篇具有很好参考价值的文章主要介绍了mysql执行顺序与索引算法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

SQL查询中用到的关键词:select、distinct、from、join、on、where、group by、having、sum、count、max、avg、order by、limit

一、书写顺序:

select->distinct->from->join->on->where->group by->having->order by->limit

必须字段:select、from

可选字段:distinct、join、on、where、group by、having、sum、count、max、avg、order by、limit

二、执行顺序

from->on->join->where->group by(开始使用select中的别名,后面的语句中都可以使用别名)->sum、count、max、avg->having->select->distinct->order by->limit

mysql大致执行顺序如下:

  1. from 阶段

  2. where 阶段

  3. group by 阶段

  4. having 阶段

  5. select 阶段

  6. order by 阶段

  7. limit 阶段

三、提问

问题:为什么字段别名不可以使用在where中,但可以使用在order by中?

因为select的执行顺序靠后,所以在它之前执行的查询阶段,都不能使用。而order by阶段是在select的后面,所以是可以使用字段别名的。

四、关键词含义

  • from:需要从哪个数据表检索数据(需要检索那张数据表)
  • join:对需要关联查询的表进行关联(需要关联那种查询表)

关联查询时,数据库会选择一个驱动表,然后用此表的记录去关联其他表
left join一般以左表为驱动表(right join一般为右表),inner join一般以结果集少的表为驱动表,left join某些情况下会被查询优化器优化为inner join

驱动表选择原则:在对最终结果集没影响的前提下,优先选择结果集最少的那张表作为驱动表

注:可以使用explain查找驱动表,结果的第一张表即为驱动表,但执行计划在真正执行时可能发生改变

  • on:关联条件

  • where:过滤表中数据的条件

    • 执行顺序:自下而上、从右到左
    • 注:对数据库记录生效,无法对聚合结果生效,可以过滤掉最大数量记录的条件必须写在where子句末尾,不能使用聚合函数(sum、count、max、avg)
  • group by:如何将上面过滤出的数据分组

    • 执行顺序:从左往右
    • 注:尽量在group by之前使用where过滤,避免之后使用having过滤
  • avg:求平均值

  • having:对上面已经分组的数据进行过滤的条件

    • 注:对聚合结果过滤,因此很耗资源,可以使用聚合函数

    • 例:筛选统计人口数量大于100W的地区

      select region, sum(population), sum(area) from bbc group by region having sum(population)>1000000,不能用where筛选超过100W的地区,因为不存在这样的一条记录

  • select:查看结果集中的哪个列或列的计算结果

  • distinct:对结果集重复值去重

  • order by:按照什么样的顺序来查看返回的数据

    • 执行顺序:从左到右
    • 注:很耗资源
  • limit:截取出目标页数据

五、索引关联中使用的算法

  • 使用索引关联的情况下,有Index Nested-Loop join(索引套用循环连接)和Batched Key Access join(批量密钥访问连接)两种算法
  • 未使用索引关联的情况下,有Simple Nested-Loop join(简单嵌套循环连接)和Block Nested-Loop join(缓存块嵌套循环连接)两种算法

算法分析

  • Simple Nested-Loop join(SNLJ,简单嵌套循环连接)算法:根据on条件,从驱动表取一条数据,然后全表扫面被驱动表,将符合条件的记录放入最终结果集中。这样驱动表的每条记录都伴随着被驱动表的一次全表扫描
    • 匹配次数:外层表行数*内层表行数
  • Index Nested-Loop Join(INLJ,索引嵌套循环连接)算法:索引嵌套循环连接是基于索引进行连接的算法,索引是基于内层表的,通过外层表匹配条件直接与内层表索引进行匹配,避免和内层表的每条记录进行比较, 从而利用索引的查询减少了对内层表的匹配次数
    • 匹配次数:外层表行数*内层表索引高度
  • Block Nested-Loop Join(BNLJ,缓存块嵌套循环连接)算法:缓存块嵌套循环连接通过一次性缓存多条数据,把参与查询的列缓存到Join Buffer 里,然后拿join buffer里的数据批量与内层表的数据进行匹配,从而减少了内层循环的次数(遍历一次内层表就可以批量匹配一次Join Buffer里面的外层表数据)。
    当不使用Index Nested-Loop Join的时候,默认使用Block Nested-Loop Join
  • Batched Key Access join(BKAJ)算法:和SNLJ算法类似,但用于被join表上有索引可以利用,那么在行提交给被join的表之前,对这些行按照索引字段进行排序,因此减少了随机IO,排序这才是两者最大的区别,但是如果被join的表没用索引呢?那就使用BNLJ了

六、什么是Join Buffer?

  • Join Buffer会缓存所有参与查询的列而不是只有Join的列。

  • 可以通过调整join_buffer_size缓存大小

  • join_buffer_size的默认值是256K,join_buffer_size的最大值在MySQL 5.1.22版本前是4G,而之后的版本才能在64位操作系统下申请大于4GJoin Buffer空间。

  • 使用Block Nested-Loop Join算法需要开启优化器管理配置的optimizer_switch的设置block_nested_loopon,默认为开启。

  • 在选择Join算法时,会有优先级,理论上会优先判断能否使用INLJ、BNLJ:
    Index Nested-LoopJoin > Block Nested-Loop Join > Simple Nested-Loop Join

参考链接:

  1. SQL执行顺序

  2. MySQL执行顺序文章来源地址https://www.toymoban.com/news/detail-508714.html

到了这里,关于mysql执行顺序与索引算法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux日志相关命令—查看\关键词查询\截取\日志压缩备份

    1、动态日志查看。 说明:程序启动可以动态查看运行日志。 2、显示最后100行 说明:动态日志没有写入的时候,可以用该命令查询最后的几行 常用(可记住): 说明:会查询日志文件中涉及的那一行,并显示出来,在日志中出现太多就不好定位。 说明:搜索

    2024年02月17日
    浏览(74)
  • 关键词提取 | 基于Textrank算法的两种关键词提取

    目录 一、PageRank算法 二、TextRank算法 1. 抽取(keyword extraction) 2. 关键短语抽取(keyphrase extration) 3. 关键句抽取(sentence extraction) 三、TextRank算法实现 1. 基于Textrank4zh的TextRank算法实现 2. 基于jieba的TextRank算法实现 3. 基于SnowNLP的TextRank算法实现 四、PageRank算法与Text

    2024年04月14日
    浏览(66)
  • 中文关键词提取算法

    如何提取query或者文档的? 一般有两种解决思路: 有监督方法,把提取问题当做分类问题,文本分词后标记各词的重要性打分,然后挑出重要的topK个词; 无监督方法,使用TextRank、TFIDF等统计算法区分各词的term weight,然后按weight排序后挑出重要的topK个词。 有

    2024年02月08日
    浏览(47)
  • 【自然语言处理】利用 TextRank 算法提取关键词

    TextRank 是一种基于 PageRank 的算法,常用于提取和文本摘要。在本文中,我将通过一个提取示例帮助您了解 TextRank 如何工作,并展示 Python 的实现。 使用 TextRank、NER 等进行提取 关于 PageRank 的文章有很多,我只简单介绍一下 PageRank。这将有助于我们稍后理

    2024年02月05日
    浏览(47)
  • php+mysql实现微信公众号回复关键词新闻列表

    非常抱歉,我之前理解有误。如果您想要实现在公众号发送,返回新闻列表的功能,可以按照以下步骤进行操作: 1. 创建一个数据库表,用于存储新闻的标题、链接和内容等信息。例如,可以创建一个名为news的表,包含id、title、link和content等字段。 2. 在公众号后台设

    2023年04月16日
    浏览(43)
  • 【评论内容关键词提取】多种主流提取算法与大模型测试

      做过舆情项目或文本内容情感分析的大家都知道,我们要从大量的文本内容中提取核心短语或者!最近我们的爬虫项目中正好遇到了这么一个需求,我们收集了大量的评论内容文本数据,需要从中分析提炼( 最好能够找带情感色彩来提炼更佳 ) 本次测试的

    2024年02月07日
    浏览(37)
  • 双方案-基于Mysql 与 ElasticSearch实现关键词提示搜索与全文检索

    就喜欢搞这种不需要怎么费劲的东西,只需要把思路阐述清楚,随笔性质的博文,顺手啊,几乎不用改定就可以当博文发布出去。 那么,这里的话我们要做的就是实现这个的一个搜索功能,这个前端我就不说了,实现起来起来其实还是容易的,就是费劲。我们主要关注

    2024年01月18日
    浏览(52)
  • 文本分析-使用jieba库实现TF-IDF算法提取关键词

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+         TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率)是一种用于资讯检索与资

    2024年02月11日
    浏览(46)
  • 数据库--SQL关键字的执行顺序

    数据库-- 数据类型 : http://t.csdn.cn/RtqMD 数据库-- 三大范式、多表查询、函数sql: http://t.csdn.cn/udJSG 数据库-- MySQL增删改查: http://t.csdn.cn/xkiti select   from   join   where   group by   having   order by   聚合函数   limit   top  以及逻辑运算符not  and    or    一: 语法顺序    

    2024年02月12日
    浏览(40)
  • NLP自然语言处理——关键词提取之 TextRank 算法(五分钟带你深刻领悟TextRank算法的精髓)保姆级教程

    🔥博客主页:是dream 🚀系列专栏:深度学习环境搭建、环境配置问题解决、自然语言处理、语音信号处理、项目开发 💘每日语录:你要做冲出的黑马 🐎  而不是坠落的星星。 🎉感谢大家点赞👍收藏⭐指正✍️         提取是将文本中的关键信息、核心概念或

    2024年02月04日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包