MySQL为什么选择B+树创建索引

这篇具有很好参考价值的文章主要介绍了MySQL为什么选择B+树创建索引。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 全表遍历

  • 将磁盘中存储的所有数据记录依次加载,与给定条件对比,直到找到目标记录;
  • 类比数组结构的线性查找,效率较低;

2. 哈希结构

  • 结合数组和链表结构(或者树结构)存储数据;
  • 通过哈希函数(散列函数)计算哈希地址,相同输入在固定函数下输出保持不变;
  • 哈希结构会发生哈希冲突,使用哈希桶或者红黑树可缓解哈希冲突;
  • 哈希结构查找效率较高,为O(1);
  • InnoDB和MyISAM存储引擎均不支持哈希索引,而Memory存储引擎支持哈希索引;

2.1 使用哈希结构创建索引的缺点

  • 哈希索引可满足等值查询(==、!=、IN),对于范围查询,效率较低;
  • 哈希索引下数据存储无序,对于排序查询效率较低;
  • 对于联合索引,哈希索引将多个列结合进行哈希计算,因此对于单独的列无法进行查询;
  • 哈希索引容易发生哈希冲突,此时查找效率降低;

2.2 哈希索引的适用性

  • InnoDB存储引擎不支持哈希索引,但提供了自适应哈希索引(Adaptive Hash Index)提高数据检索效率;
  • 可通过show variables like '%adaptive_hash_index';查看MySQL是否开启了自适应哈希索引;
  • 自适应哈希索引(Adaptive Hash Index):如果某个数据页被频繁访问,则当满足一定条件时将该数据页对应地址存储在哈希表中,如此下次访问该数据页时可直接由哈希表中的地址获取,而不用在B+树中检索;
    MySQL为什么选择B+树创建索引,MySql,Java开发,mysql,b树,数据库,数据结构,java

3. 二叉搜索树

  • 本质是二叉树;
  • 限制条件:左<根<右,即任意一颗子树,其根节点的值大于左子树所有节点的值,同时小于右子树所有节点的值;
  • 二叉搜索树一般查找效率较高,时间复杂度为O(log2n);

MySQL为什么选择B+树创建索引,MySql,Java开发,mysql,b树,数据库,数据结构,java

  • 缺点:极端情况下会退化为单链表,查找效率降低;
    MySQL为什么选择B+树创建索引,MySql,Java开发,mysql,b树,数据库,数据结构,java

4. AVL树

  • AVL树即平衡二叉搜索树;
  • 限制条件:二叉搜索树的任意子树的左右子树高度差绝对值不能超过1;
  • 优点:解决了二叉搜索树退化为单链表的问题;
  • 缺点:虽然二叉树实现简单,但如果数据量巨大,会导致二叉树高度过大,查找效率降低;
    MySQL为什么选择B+树创建索引,MySql,Java开发,mysql,b树,数据库,数据结构,java

5. B树

  • 本质是多叉平衡搜索树,可解决AVL树高度过高的问题,提高查找效率;
    MySQL为什么选择B+树创建索引,MySql,Java开发,mysql,b树,数据库,数据结构,java

6. B+树

  • 本质是多叉平衡搜索树,基于B树做了一定改进,更适合于文件索引系统;
  • B+树非叶节点中不存储真实数据,只存储索引;
    MySQL为什么选择B+树创建索引,MySql,Java开发,mysql,b树,数据库,数据结构,java

6.1 B+ 树和 B 树的差异

  • 有 k 个孩子的节点就有 k 个关键字。也就是孩子数量 = 关键字数,而 B 树中,孩子数量 = 关键字数
    +1;
  • 非叶子节点的关键字也会同时存在在子节点中,并且是在子节点中所有关键字的最大(或最小);
  • 非叶子节点仅用于索引,不保存数据记录,跟记录有关的信息都放在叶子节点中。而 B 树中, 非
    叶子节点既保存索引,也保存数据记录;
  • 所有关键字都在叶子节点出现,叶子节点构成一个有序链表,而且叶子节点本身按照关键字的大小从小到大顺序链接;

6.2 采用B+树创建索引的优势

  • B+树的内节点不存储真实数据记录,而B树内节点会存储部分真实数据;
  • B+树查询效率更加稳定;
  • B+树高度更低,查询效率更高;
  • 对于范围查询,B+树只有叶子结点存储有序的真实数据,因此查询效率更高;

6.3 一些需要注意的问题

1)为了减少IO,索引树会一次性加载吗?

  • 如果数据表存储的数据量非常大,则对应的索引文件可能也会很大,如果一次性加载到内存,对于内存要求较高;
  • 实际情况下,对于索引文件的加载是逐一进行的;

2)B+树的存储能力如何?为何说一般查找行记录,最多只需1~3次磁盘IO?

  • B+树为多叉平衡搜索树,每个节点对应一个真实数据页,每个数据页默认大小为16KB;
  • 主键类型一般采用INT(4B)或BIGINT(8B),指针类型一般也占据4B或8B ,最大情况下一个数据页可以存储16KB/(8B+8B)≈1000条记录;
  • 对于目录项记录页,每个数据页假设可存储1000条记录,则当B+树高度为3时,可存储约109条记录,数据量非常庞大;
  • 实际情况中,B+树上面三层可能不会完全填充,因此实际B+树一般设计为2~4层,也就是磁盘I/O次数为2~4次。但InnoDB存储引擎设计时将根节点常驻在内存,所以实际磁盘I/O次数为1~3次;

3)为什么说B+树比B-树更适合实际应用中操作系统的文件索引和数据库索引?

B+树只有叶子结点存储真实数据,查询效率更高更稳定,磁盘占用更少;

4)Hash 索引与 B+ 树索引的区别?

  • InnoDB存储引擎不支持Hash索引;
  • Hash索引数据存储无序,不支持ORDER BY排序,也不支持模糊查询;
  • Hash索引数据存储无序,不能进行范围查询;
  • Hash索引不支持联合索引的最左侧原则,即联合索引的部分索引无法使用;

5)Hash 索引与 B+ 树索引是在建索引的时候手动指定的吗?

  • InnoDB、MyISAM存储引擎不支持Hash索引,对于InnoDB提供的自适应哈希索引默认开启,不需要手动指定;
  • Memory存储引擎默认采用Hash索引;

参考《尚硅谷》文章来源地址https://www.toymoban.com/news/detail-536530.html

到了这里,关于MySQL为什么选择B+树创建索引的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MySQL为什么要使用B+树做索引?MySQL索引存储模型推演,B+树在MySQL的落地形式

    user_innodb这张表里有4个字段,id,name,gender,phone。 当这张表有500万条数据,在没有索引的name字段上执行一条where查询: 如果name字段上有索引呢?我们在name字段上面创建一个索引,再来执行一下查询: 我们再来执行一下select语句。 我们会发现,有索引的查询和没有索引的

    2024年02月16日
    浏览(54)
  • MySQL为什么采用B+树作为索引底层数据结构?

            索引就像一本书的目录,通过索引可以快速找到我们想要找的内容。那么什么样的数据结构可以用来实现索引呢?我们可能会想到:二叉查找树,平衡搜索树,或者是B树等等一系列的数据结构,那么为什么MySQL最终选择了B+树作为索引的数据结构呢?         要想

    2024年02月16日
    浏览(46)
  • MySQL 索引为什么使用 B+ 树,而不使用红黑树 / B 树 ?

    首先 B 树和 B+ 树 都是多叉搜索树,然后我们先来观察一下 B+ 树和 B 树的数据结构: B+ 树的数据结构实现  B 树的数据结构实现 【B+ 树相较于 B 树的优势】 1. IO 次数更少(查询效率更高)         B+ 树的非叶子节点不存放实际的数据,仅存放索引,因此数据量相同的情况

    2024年02月12日
    浏览(41)
  • MSQL系列(十二) Mysql实战-为什么索引要建立在被驱动表上

    Mysql实战-为什么索引要建立在被驱动表上 前面我们讲解了B+Tree的索引结构,也详细讲解下 left Join的底层驱动表 选择原理,那么今天我们来看看到底如何用以及如何建立索引和索引优化 开始之前我们先提一个问题, 为什么索引要建立在被驱动表上 ? 1.建表及测试数据 我们先

    2024年02月08日
    浏览(45)
  • android studio创建一个新的项目为什么默认是kotlin语言而选择不了java语言

    关于android studio语言选择的问题。 我在进入android studio为什么创建一个新项目之后选择不了java语言有什么办法可以解决。 解决办法:这个模式下选着一个Empty Activity模块就可以使用java语言。 这对于刚刚接触anaroid studio新手比较管用。  

    2024年02月11日
    浏览(56)
  • 为什么Java是物联网的完美选择

    在过去的十年中,我们见证了各种设备通过网络连接在一起,各种传感器、温度计、交通、流速传感器以及数据传输。大家都听说过互联网,那有没有听说过物联网呢?大家下面可以跟着袁老师的步伐探讨物联网相关的内容。 我们都知道,Java语言在开发上优势明显,稳定性

    2024年01月21日
    浏览(42)
  • Redis—Redis介绍(是什么/为什么快/为什么做MySQL缓存等)

    一、Redis是什么 Redis 是一种 基于内存的数据库 ,对数据的读写操作都是在内存中完成,因此读写速度非常快,常用于 缓存,消息队列、分布式锁等场景 。         Redis 提供了多种数据类型来支持不同的业务场景,比如 String(字符串)、Hash(哈希)、 List (列表)、Set(集合)、

    2024年02月10日
    浏览(66)
  • mysql插入数据会失败?为什么?

    那天,我还在外面吃成都六姐的冒菜。 牛肉丸裹上麻酱后,狠狠嘬一口,都要入嘴了。 产品经理突然发来消息。 \\\"线上有些用户不能注册了\\\" 心想着\\\"关我x事,又不是我做的模块\\\",放下手机。 不对,那老哥上礼拜刚离职了,想到这里,夹住毛肚的手 微微颤抖 。 对面继续发:

    2024年02月05日
    浏览(46)
  • mysql为什么用b+树

    目前的mysql索引使用b+树结构, b+树使用内部节点存储key和指针,叶子节点存储数据, 内部节点没有存储具体data, 结构变得矮胖 使得 io次数变少 , 性能提高 , 由于数据的查询都是从根节点到叶子节点的查询路径, b+树的查询路径相同, 查询非常稳定 B树没有内部节点和叶子结点的区

    2024年02月08日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包