MySQL索引的底层结构

这篇具有很好参考价值的文章主要介绍了MySQL索引的底层结构。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. MySQL中的索引

本质是一种‘排好序的数据结构’,可以帮助快速查找数据。可以类比目录理解。

不能全加上索引的原因

虽然它查询使用优化隐藏器提高性能,但是也会相应占物理空间,从而导致降低增删改的速度,因为操作数据的同时也要‘维护索引文件’。

2. 索引的底层数据结构

常规的搜索引擎一般都是采用B树或者B+树来实现索引的存储。

常用的是B+树和Hash,常用的InnoDB引擎就是B+树实现的。

不使用hash作为索引的原因

hash底层是哈希表实现,等值查询,可以快速定位,一般情况效率很高,不稳定,无法用于排序分组,无法模糊查询。

树的高度与磁盘之间的关系

MySQL索引的底层结构
B树是一种多路平衡树,用这种存储结构来存储大量数据的情况,其整体高度相比二叉树来说会矮很多

对于数据库来说,所有数据必然是存储在磁盘上的,而磁盘IO的效率实际上是很低的。特比是在随机磁盘IO的情况下,效率更低,所以树的高度就能决定磁盘IO的次数。磁盘IO次数越少,对性能提升就会越大。

但是,在MySQL的InnoDB存储引擎里面,它采用的是一种增强的B树结构,也就是B+树来作为索引和数据的一个存储结构。

MySQL索引的底层结构
相比于B树,B+树做了几个方面的一个优化:

  1. B+树的所有数据都存储在叶子节点,非叶子节点只存储索引。
  2. 叶子节点中的数据使用双向链表的方式进行关联的。

选用B+树不使用B树的原因

  1. B+树只在叶子节点储存数据,非叶子结点存索引,而一个节点就是磁盘一个内存页,内存页大小固定。所以每一层能够存储的索引数量会增加。那么相比B树,这些便可以存更多的索引节点,出度更大,树高也就会更矮,这样查询次数少,磁盘IO次数少,性能也就更佳。

  2. 叶子节点中的数据使用双向链表的方式进行关联的。MySQL中,范围查询是一个比较常用的操作,而B+树的所有存储在叶子节点的数据使用了双向链表来关联,所以在查询的时候只需查两个节点进行遍历就行,而B树需要获取所有节点,所以B+树在范围查询上效率更高

  3. 数据检索方面,由于所有的数据都存储在叶子节点,所以B+树的IO次数会更加稳定一些

  4. 因为叶子节点存储所有数据,所以B+树全局扫描能力更强一些,因为它只需要扫描叶子节点。但是B树需要遍历整个树

另外,基于B+树这一个结构,如果采用自增的整型数据作为主键,还能够更好的去避免增加数据的时候带来的叶子节点分裂导致了大量运算的一个问题。

总的来说,技术方案的选择,更多的是去解决当前场景下的一些特定问题。并不一定B+树就是最好的选择。

就像MongoDB中采用B树结构,本质上来说是关系型数据库和非关系型数据库的一个差异。

3. 索引的类型

3.1 普通索引

普通索引是最简单的索引类型,它与数据库表中的列一一对应。当你在某一列上创建普通索引时,数据库系统会根据该列的值构建一个数据结构,以便更快地定位和检索数据。普通索引并没有太多的限制,可以在大多数类型的列上创建,包括数字、文本等。

3.2 主键索引

主键索引是数据库表中一种特殊的索引类型,它与表的主键相关联。主键是表中的一列或一组列,其值可以唯一标识表中的每一行数据。主键索引的目的是通过加速对主键列的检索来提高表的查询性能。

3.3 唯一索引

唯一索引是数据库中一种索引类型,它与表的某一列相关联,确保该列的值在整个表中是唯一的。唯一索引的作用是防止表中的重复数据,从而保证索引列的唯一性。

3.4 全文索引

全文索引是一种用于在文本数据中进行快速和高效搜索的索引类型。它不同于传统的索引,传统的索引主要针对结构化数据中的列,而全文索引则专注于非结构化文本数据,例如文章、博客、电子邮件等。

3.5 覆盖索引

其实‘覆盖索引’很好理解,就是索引字段覆盖了查询语句涉及的字段,直接通过索引文件就可以返回查询所需的数据,不必通过回表操作。

3.6 聚簇索引

数据库中一种特殊的索引类型,它决定了表中数据行的物理存储顺序。与其他类型的索引不同,聚簇索引的顺序与表中数据行的物理存储顺序一致。

3.7 非聚簇索引

数据库中的一种索引类型,与聚簇索引相对。与聚簇索引不同,非聚簇索引的顺序与表中实际数据行的物理存储顺序无关。

4. 如何选择索引

4.1 从表面的基本特性考虑

普通索引可以重复,唯一索引只能是唯一一个,当然可以为空,而主键索引也是唯一的,不过它不能为空,因为它要作为聚簇索引排列,这就是为啥我们使用主键时不能为null。

4.2 性能和底层来分析

查询:以页为单位将数据页加载进内存,不需要一条记录一条记录读取磁盘。

然后唯一索引根据条件查询到记录时就返回结果,而普通索引查到第一条记录往后遍历直到不满足条件。

由于都在内存中,不需要磁盘读取那么大开销,带来的额外查询开销忽略不计,所以查询性能几乎一致。

因此,对于查询,选择普通索引、唯一索引都差不多。

更新:唯一索引由于更新时要检查唯一性,所以需要将数据页先加载进内存才能判断,此时直接操作内存,不需要操作change buffer

普通索引若数据在内存中就直接在内存中更新,否则会将更新操作先记录到change buffer中,等下一次查询将数据读到内存中再进行change buffer里相关更新操作后将数据返回。

这样一来,在写多读少的情况下就减少了磁盘IO,若写完就马上查询,就大可不必用change buffer, 不但没提高多少效率还造成维护change buffer额外消耗。

因此,在写多读少的情况下,选用普通索引更好。

因为普通索引可以利用change buffer进行性能优化减少磁盘IO,将更新操作记到change buffer,等查询来了将数据读到内存再进行修改。

5. 回表操作

通过索引去找到主键,再根据主键ID去主键索引查,‘InnoDB’使用聚簇索引,它的二级索引就是这样一个模式。

6. 最左匹配原则

联合索引(a,b,c)

select * from table_xl where c = ‘1’ and b = ‘2’ and a = ‘3’ 会走索引吗?
这是全值匹配查询,查询优化器会自动优化查询顺序。

select * from table_xl where a = 1 and b > 3 会走索引吗?
a = 1的情况下b是有序的,进行范围查找走的是联合索引,会走a b 索引。

参考资料:文章来源地址https://www.toymoban.com/news/detail-421084.html

  1. 【大厂面试】终于上岸了,没想到MySQL索引会这样问
  2. 【Java最新面试题】阿里一面:Mysql为什么使用B+树作为索引结构?

到了这里,关于MySQL索引的底层结构的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MySQL面试题--索引概念以及底层

    目录 概述 索引的底层数据结构 二叉树 B树  B+树 B树与B+树对比: 面试回答 大纲 回答         索引(index)是帮助MySQL 高效获取 数据的数据结构(有序)。         在数据之外,数据库系统还维护着满足特定查找算法的数据结构( B+树 ),这些数据结构以某种方式 引用

    2024年02月11日
    浏览(32)
  • 一文让你对mysql索引底层实现明明白白

    图片是本人随笔画的,有点粗糙,望大家谅解,如有不妥之处,请联系我们,感谢 .索引是帮助mysql高效获取数据的排好序的数据结构 .索引是存储在文件里的 .数据结构: 二叉树 HASH BTREE       如果没有索引的话,循环一条一条的找,找一次就是一次IO,这样速度就会很慢 我

    2024年01月16日
    浏览(39)
  • elasticsearch中的数据类型search_as_you_type及查看底层Lucene索引

    search_as_you_type字段类型用于自动补全,当用户输入搜索的时候,还没输完就可以提示用户相关内容。as_you_type应该是说当你打字的时候。它会给索引里的这个类型的字段添加一些子字段_2gram _3gram和_index_prefix。_2gram的意思是,如果一个值是abcd, 2 gram就是ab bc cd, 3 gram就是

    2024年02月12日
    浏览(48)
  • MySQL底层数据结构

    一个sql语句在mysql中究竟是如何运行的?又应该通过怎样的方式去查找我们要找的数据?这里就涉及到几种存储数据的算法; 可以做索引的数据结构有数组、链表、二叉搜索树和B树(B-树、B+树)。 2.1、HASH 由于HASH查询和写入的时间复杂度是O(1),这意味着只需要一次hash计算就

    2024年02月08日
    浏览(45)
  • Mysql索引(2):索引结构

    1 概述 MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构,主要包含以下几种: 索引结构 描述 B+Tree索 最常见的索引类型,大部分引擎都支持 B+ 树索引 Hash索引 底层数据结构是用哈希表实现的, 只有精确匹配索引列的查询才有效, 不支持范围查询 R-tree(空间

    2024年02月03日
    浏览(42)
  • (一)深入理解Mysql底层数据结构和算法

    索引是帮助MySQL高效获取数据的排好序的数据结构 数据结构模拟网站:Data Structure Visualization 二叉树 不适合做自增ID的数据结构。如下示意图,假设采用二叉树作为表自增主键ID的数据存储结果如下:当查询id为5的数据时,其查询次数为5次 红黑树 不适合做mysql的索引,因为当

    2024年01月25日
    浏览(65)
  • [MySQL] MySQL中的索引

    文章目录 一、初识索引 1、1 索引的概念 1、2 索引案例 二、认识磁盘 2、1 磁盘结构 2、2 操作系统与磁盘的数据交互 2、3 磁盘随机访问与连续访问 2、4 MySQL与磁盘的数据交互 三、索引的理解 3、1 建立测试表 3、2 为何MySQL与磁盘IO交互是 Page 3、3 理解Page 3、3、1 页目录 3、

    2024年02月04日
    浏览(37)
  • MySQL之索引结构

    索引是帮助MySQL 高效获取数据 的 数据结构 (有序)。 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。 下图演示有索引和无索引的区别

    2024年01月22日
    浏览(30)
  • MySQL存储结构及索引

    1). 连接层 最上层是一些客户端和链接服务,包含本地sock 通信和大多数基于客户端/服务端工具实现的类似于 TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程 池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可

    2024年02月13日
    浏览(51)
  • MySQL 索引结构浅析

    上面是二叉树和红黑树的结构,其实 红黑树是一个自平衡二叉查找树 ,可以用于解决二叉树顺序插入时形成一个有序链表问题。 但是两者都有一个明显缺点,就是 当数据量过大时,层级较深,检索速度慢。 下面分析一下 B树( 多路 平衡查找树) 名词解析: 度数:指的是

    2024年02月14日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包