【算法证明 五】并查集的时间复杂度

这篇具有很好参考价值的文章主要介绍了【算法证明 五】并查集的时间复杂度。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

相信如果不是为了刷 leetcode 外,很少有数据结构的数介绍并查集这一数据结构的。并查集的算法模板写起来非常容易,所以刷了并查集相关算法题的人,应该也不会去深入分析这一数据结构,最多知道路径压缩、按秩合并可以做到非常快。深入一点知道 阿克曼函数 α ( n ) 阿克曼函数\alpha(n) 阿克曼函数α(n)就很不错了。
一般的分析方法,很难分析并查集这一数据结构的复杂度。并查集本质是一种森林,更确切的说是一种图论算法。如果不知道方法,分析这类数据结构与算法的复杂度是很难的,很容易让思维陷入困局,无法入手。分析这种算法的常用方式就是摊还分析。

数据结构接口定义

定义一组集合: S 1 , S 2 . . . , S k S_1,S_2...,S_k S1,S2...,Sk和一组元素 e 1 , e 2 . . . e n e_1,e_2...e_n e1,e2...en,某一个元素在同一时刻只能属于一个集合,即集合之间是不相交的。
再定义三个接口:

  1. M a k e ( e ) 用元素 e 开一个集合 Make(e)用元素e开一个集合 Make(e)用元素e开一个集合
  2. U n i o n ( S 1 , S 2 ) 将两个集合合并 Union(S_1, S_2)将两个集合合并 Union(S1,S2)将两个集合合并
  3. F i n d ( e ) 返回元素 e 所属的集合 Find(e)返回元素e所属的集合 Find(e)返回元素e所属的集合

其实现可以随意,但通常用集合内的某一个元素来代指一个集合。以上便是并查集数据结构的抽象定义。实际应用中,就是以上三个接口的操作序列:
< M a k e , M a k e , . . . . , U n i o n , . . . , F i n d , . . . , U n i o n , . . , F i n d > <Make, Make, ....,Union,...,Find, ...,Union,..,Find> <Make,Make,....,Union,...,Find,...,Union,..,Find>
通常是 m a k e make make在前, U n i o n Union Union F i n d Find Find在后杂乱的形成一组操作序列。所以该数据结构的复杂度分析,就是分析这一组序列的总代价和平均代价。这就是也摊还分析技术出场的地方了。首先我们设初始元素个数为 n n n,操作序列的长度为 m m m。显然 m ≥ n m \ge n mn

链表实现

用链表来实现该数据结构是比较简单的。集合结构包含一个链表头节点和尾节点。每一个链表节点表示集合中的一个元素。链表节点中包含一个next指向下一个链表,包含一个 S 指针指向属于的集合节后。
在上面的定义链表实现中, m a k e make make操作和 F i n d Find Find操作都是 O ( 1 ) O(1) O(1)的。核心在于 U n i o n Union Union操作。简单的 U n i o n Union Union操作就是把S_2中的所有元素的S指针指向S_1。将S_2的链表插入S_1中。这样, U n i o n Union Union操作的复杂度为跟S_2的链表长度有关。容易想到,这种方法的最坏情况就是将n个集合依次合并的情况。总复杂度为 ∑ 1 n i = Θ ( n 2 ) \sum_1^ni=\Theta(n^2) 1ni=Θ(n2),每个操作摊还复杂度为 Θ ( n ) \Theta(n) Θ(n)

  • 加权合并策略

上面最坏情况的构造,是基于每次将最长的集合,合并入短的集合内。如果加一种启发式策略,每次判断一下,将较短的集合,合并入较长的集合内,算法又该如何分析呢?还是只考虑复杂情况 U n i o n Union Union的复杂度变化。首先,我们最多执行Union操作n-1次。我们不妨考虑更底层的情况:考虑任意一个元素e的S指针被更新的次数。
由于我们采用将较小集合的S指针更新,因此第一次e被更新后,其所在集合中元素的数量一定 ≥ 2 \ge2 2。下依次e被更新后,其所在集合中的元素数量一定 ≥ 4 \ge4 4。当e所在的集合数量 ≥ n / 2 \ge n/2 n/2时,e的S指针将不再更新,故每个e的S指针最多被更新 l g n lgn lgn次。所以n-1次Union操作的总代价应 ≤ n l g n \le nlgn nlgn。所以序列的最坏情况下总代价为 O ( m + n l g n ) O(m+nlgn) O(m+nlgn)。摊还复杂度,最坏情况下为 O ( l g n ) O(lgn) O(lgn)

看,其实用看起来不怎么好的链表实现加上简单的加权合并,并查集的摊还复杂度就已经来到 O ( l g n ) O(lgn) O(lgn)了。

森林实现

森林实现就是我们常见的刷题模板了

// Make
int p[MAX_N], r[MAX_N];
for (int i = 0; i < n; i++) p[i] = i;

int find(int i) { 
	// 不带路径压缩
	while(p[i] != i)
		i = p[i];
	return i;
	// 路径压缩
	// return p[i] == i ? i : p[i] = find(p[i]);
}

void union(int x, int y) {
	x = find(x);
	y = find(y))
	if(r[x] > r[y]) 
		p[y] = x;
	else {
		p[x]=y;
		if (r[x]==r[y]) r[y]++;
	}
}

如果将 r 数组想象成链表实现中的秩的话,其证明过程是类似的,可以得到,按秩合并产生的运行时间为O(mlgn)。但是find操作要慢一些,不过可以分析其最坏情况就是在序列的最后,find 树中最深的元素,所以也是O(mlgn)的。所以单独使用按秩合并,最坏情况下摊还复杂度还是 O ( l g n ) O(lgn) O(lgn)

优化最好的路径压缩。这里并不打算证明(以后再说),只给出结论:当使用路径压缩时,长度为m的序列操作的总代价是 O ( m α ( n ) ) O(m\alpha(n)) O(mα(n)) α ( n ) \alpha(n) α(n)函数是增长非常慢的一种函数,当 2048 ≤ n ≤ 1 6 512 2048 \le n\le16^{512} 2048n16512是, α ( n ) \alpha(n) α(n) 仅为4。所以在实际应用中当作 O ( 1 ) O(1) O(1)也无妨。因此摊还代价为 O ( 1 ) O(1) O(1)

重要的是理解摊还分析的建模和分析思路:即定义一组操作序列,从整体的角度出发,计算所有操作的代价总和。例如,我们这里并没有直接计算 U n i o n Union Union操作的最坏复杂度,而是从一个元素被更新所属集合的次数出发,求得了代价总和。文章来源地址https://www.toymoban.com/news/detail-502286.html

到了这里,关于【算法证明 五】并查集的时间复杂度的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 算法的时间复杂度和空间复杂度

    目录 本章重点 一 时间复杂度 2.1 时间复杂度的概念 2.2 大O的渐进表示法 2.3 常见的时间复杂度的计算 二 空间复杂度 三 常见复杂度对比 四 复杂度的oj练习 4.1 消失的数字 4.2 旋转数字 每一天都是人生限定,每一天都值得100%努力 (1)算法效率(2)时间复杂度(3)空间复

    2024年02月01日
    浏览(32)
  • 算法的时间复杂度与空间复杂度

    1.算法效率 2.时间复杂度 3.空间复杂度 4.复杂度oj题目 1.算法效率 1.1 如何衡量一个算法的好坏 一辆车的好坏我们可以从价格,油耗...... 方面来衡量,但衡量一个算法的好坏我们该从哪一个方面入手呢?比如斐波那契数列: 斐波那契数列的递归实现方式非常简洁,但简洁一定

    2024年02月15日
    浏览(67)
  • 算法学习22:时间复杂度 和 空间复杂度

    提示:以下是本篇文章正文内容: 😍😍😍文章链接👍👍👍 提示:这里对文章进行总结: 💕💕💕

    2024年04月22日
    浏览(52)
  • 算法的时间复杂度、空间复杂度如何比较?

    目录 一、时间复杂度BigO 大O的渐进表示法: 例题一: 例题2: 例题3:冒泡排序的时间复杂度 例题4:二分查找的时间复杂度 书写对数的讲究: 例题5:  实例6: 利用时间复杂度解决编程题 ​编辑思路一: 思路二: 源码: 思路三: 回顾位操作符 二、空间复杂度详解 概念

    2024年02月15日
    浏览(53)
  • 八大排序算法(含时间复杂度、空间复杂度、算法稳定性)

    下列算法默认都是对数组进行升序 1.1、算法思想 插入排序是一种简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。 插入排序的具体步骤如下: 从第一个元素开始,该元素可以认为已经被排序;

    2024年02月08日
    浏览(33)
  • 如何衡量算法的效率?时间复杂度&&空间复杂度

    本篇博客会讲解如何衡量一个算法的效率。衡量算法的效率,主要有2个维度,分别是:时间复杂度和空间复杂度。 时间复杂度用来衡量算法的时间效率。时间复杂度越低,算法的耗时越短,效率则越高。 空间复杂度用来衡量算法的空间效率。空间复杂度越低,算法占用的空

    2023年04月20日
    浏览(28)
  • 数据结构:算法(特性,时间复杂度,空间复杂度)

    算法(Algorithm)是对 特定问题求解步骤 的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作。 一个算法必须总在执行有穷步之后结束,且每一步都可在有穷时间内完成。 算法必须是有穷的,而程序可以是无穷的 算法中每条指令必须有确切的含义,对于

    2024年02月06日
    浏览(34)
  • 算法的时间复杂度和空间复杂度(数据结构)

    目录 1、算法效率 1如何衡量一个算法的好坏 2算法的复杂度 2、时间复杂度 1时间复杂度的概念 2大O的渐进表示法 2时间复杂度计算例题 1、计算Func2的时间复杂度 2、计算Func3的时间复杂度 3、计算Func4的时间复杂度 4、计算strchr的时间复杂度 5、计算BubbleSort的时间复杂度 6、计算

    2024年02月03日
    浏览(31)
  • 【数据结构和算法】时间复杂度和空间复杂度

    目录   一、前言 二、时间复杂度 2.1时间复杂度表示形式 2.1.1规则: 3.1如何计算时间复杂度 3.1.1线性阶 3.1.2平方阶 3.1.3对数阶 常见的时间复杂度排序: 三、空间复杂度 3.1Java的基本类型内存占用 数据结构和算法是程序的灵魂,这是某位程序员大佬所言,学习了这门,我们便可

    2023年04月09日
    浏览(27)
  • 数据结构与算法-时间复杂度与空间复杂度

    数据结构是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。 算法就是定义良好的计算过程,他取一个或一组的值为输入,并产生一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。 算法在

    2024年02月07日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包