mysql详解之B+树的查询时间复杂度-Toy模板网

这篇具有很好参考价值的文章主要介绍了mysql详解之B+树的查询时间复杂度。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

B+ 树搜索时间复杂度到底是什么（这篇文章分析了全网各种关于b+树时间复杂度相关博客的结论，总结并分析了他们结论差异的原因）。
本文在此基础上，对文中的结论做了进一步思考（如果对解题过程不感兴趣，可以直接看最后的总结）。

正题

在这篇文章中，得知B+树在内存里的时间复杂度是：

$O(\log_2^m \cdot \log_m^n)$

然后我就想比较一下B+树和二叉树的时间复杂度。我们知道二叉树的时间复杂度是O(logn)【计算机行业的简写：把底数2给省略了】，完整的数学公式是：

$O(\log_2^n)$

注意：本文所有二叉树都指的平衡二叉树，并且和B+树一样把数据存在叶子节点上。（事实上，二叉树都时间复杂度，就是在这样的前提条件下计算出来的）。
其实文本的目的就是：观察B+树分支(度)的变化，对时间复杂度的影响（当分支为2时，就是二叉树）。

怎么比较呢？前者有两个变量，后者只有一个变量。我们可以给m固定几个数，然后观察几条函数曲线。

使用一个在线函数绘制工具

b+树的时间复杂度,数据库,数据结构,mysql,数据库,b+树

第一个是二叉树的时间复杂度函数。后三个分别是b+树的时间复杂度函数，m分别为3，4，5。

发现一个惊人的结果：他们看起来好像都完全重合了！

莫非 $\log_2^m \cdot \log_m^n = \log_2^n$ ？

在网上搜了一下相关的对数公式，没什么解题思路。

难道他们只是约等于? 只是误差很小，看不出来？不过也有可能是自己高中数学知识还给老师了，不会解而已（因为我把这个函数曲线无论怎么放大，或者往后看，都是一样的，应该不至于误差那么小）。

但当我用m去假设，带入m=2。m=4。 m=8尝试化简，结合一个对数公式，居然找到解题思路了。

解：

根据公式

$\frac{m}{n} \cdot \log_a^b = \log_{a^n}^{b^m}$

设

$m = 2^x$

变换（ $n = n^1$ ）之后，根据前面的那个公式，可得到

$\log_2^m \cdot \log_m^n = \log_2^{2^x} \cdot \log_{2^x}^{n^1} = x \cdot ( \frac{1}{x} \cdot \log_2^n) = \log_2^n$

稍微解释一下：m 为什么可以等于 $2^x$
m在这里就是大于2的自然数，这句话其实就是问 $2^x$ 能不能表示任意一个大于2的自然数。当然是可以的，因为 $2^x$ 是一条大于0的连续曲线。

所以：在内存里，当元素一样，b+树在一个节点内也采用二分法查找元素（最快的方式）。b树和二叉树的时间复杂度都是O(logN)。

总结

在内存里（不考虑磁盘io的特殊性），n叉树的查询时间复杂度都是O(logN)。

其他

关于开头那篇博客的最后一句：

$log_m^N 可以简写为 logN$

我是不太认同的。

按照作者的意思，底数m的变化对结果影响不大，可以省略。

下面这几条曲线从上到下，依次对应左边从上到下的四个函数（m=2，m=3，m=100，m=1000）

b+树的时间复杂度,数据库,数据结构,mysql,数据库,b+树

看函数曲线，对数函数确实变化非常缓，底数对结果影响也没那么明显。

当n=1000000（一百万）时

二叉树需要遍历20次，而“1000叉树”只需要2次。如果在内存里，差别确实不大，都会非常快。

但作者那句话的前提是：考虑磁盘IO。也就是说这是在讨论类似数据库的场景。

在100万正常数据量的情况下，二叉树需要磁盘io达到20次，这肯定是不可接受的。

而m=1000就是mysql一般的分叉数量级（度数），这也就我们说的：mysql的B+索引树一般就是3层。文章来源地址https://www.toymoban.com/news/detail-607698.html

到了这里，关于mysql详解之B+树的查询时间复杂度的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

mysql详解之B+树的查询时间复杂度

前言

正题

总结

其他

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2