Kruskal算法

这篇具有很好参考价值的文章主要介绍了Kruskal算法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前置知识:并查集、图的存储、贪心思想

为了保证学习效果,请保证已经掌握前置知识之后,再来学习本章节!如果在阅读中遇到困难,也可以回到前面章节查阅。

克鲁斯卡尔算法(Kruskal算法)

适用于稀疏图,时间复杂度 O(mlogm)O(mlogm)。

核心思想:从小到大挑不多余的边,属于贪心的算法。

之前介绍了求最小生成树之普里姆算法。该算法从顶点的角度为出发点,时间复杂度为O(n^2)O(n2),更适合与解决边的绸密度更高的连通网。

本节所介绍的克鲁斯卡尔算法,从边的角度求网的最小生成树,时间复杂度为O(E\log E)O(ElogE)。和普里姆算法恰恰相反,更适合于求边稀疏的网的最小生成树。

对于任意一个连通网的最小生成树来说,在要求总的权值最小的情况下,最直接的想法就是将连通网中的所有边按照权值大小进行升序排序,从小到大依次选择。

由于最小生成树本身是一棵生成树,所以需要时刻满足以下两点:

  • 生成树中任意顶点之间有且仅有一条通路,也就是说,生成树中不能存在回路;
  • 对于具有 n 个顶点的连通网,其生成树中只能有 n-1 条边,这 n-1 条边连通着 n 个顶点。

连接 n 个顶点在不产生回路的情况下,只需要 n-1 条边。

思路

所以克鲁斯卡尔算法的具体思路是:将所有边按照权值的大小进行升序排序,然后从小到大一一判断,条件为:如果这个边不会与之前选择的所有边组成回路,就可以作为最小生成树的一部分;反之,舍去。直到具有 n 个顶点的连通网筛选出来 n-1 条边为止。筛选出来的边和所有的顶点构成此连通网的最小生成树。

判断是否会产生回路的方法为:在初始状态下给每个顶点赋予不同的标记,对于遍历过程的每条边,其都有两个顶点,判断这两个顶点的标记是否一致,如果一致,说明它们本身就处在一棵树中,如果继续连接就会产生回路;如果不一致,说明它们之间还没有任何关系,可以连接。

过程

假设遍历到一条由顶点 A 和 B 构成的边,而顶点 A 和顶点 B 标记不同,此时不仅需要将顶点 A 的标记更新为顶点 B 的标记,还需要更改所有和顶点 A 标记相同的顶点的标记,全部改为顶点 B 的标记。

Kruskal算法

图 1 连通网

例如,使用克鲁斯卡尔算法找图 1 的最小生成树的过程为:

首先,在初始状态下,对各顶点赋予不同的标记(用颜色区别),如下图所示:

Kruskal算法

(1)

对所有边按照权值的大小进行排序,按照从小到大的顺序进行判断,首先是(1,3),由于顶点 1 和顶点 3 标记不同,所以可以构成生成树的一部分,遍历所有顶点,将与顶点 3 标记相同的全部更改为顶点 1 的标记,如(2)所示:

Kruskal算法

(2)

其次是(4,6)边,两顶点标记不同,所以可以构成生成树的一部分,更新所有顶点的标记为:

Kruskal算法

(3)

其次是(2,5)边,两顶点标记不同,可以构成生成树的一部分,更新所有顶点的标记为:

Kruskal算法

(4)

然后最小的是(3,6)边,两者标记不同,可以连接,遍历所有顶点,将与顶点 6 标记相同的所有顶点的标记更改为顶点 1 的标记:

Kruskal算法

(5)

继续选择权值最小的边,此时会发现,权值为 5 的边有 3 个,其中(1,4)和(3,4)各自两顶点的标记一样,如果连接会产生回路,所以舍去,而(2,3)标记不一样,可以选择,将所有与顶点 2 标记相同的顶点的标记全部改为同顶点 3 相同的标记:

Kruskal算法

(6)

当选取的边的数量相比与顶点的数量小 1 时,说明最小生成树已经生成。所以最终采用克鲁斯卡尔算法得到的最小生成树为(6)所示。

示例代码

#include <bits/stdc++.h>
using namespace std;

const int N = 1e5+5;
int n, m, ans, cnt, fa[N];

struct Edge{
    int u, v, w;
} a[N*4];
bool cmp(Edge x, Edge y) {
    return x.w < y.w;
}
int find(int x) {
    if(x == fa[x]) return x;
    return fa[x] = find(fa[x]);
}
int main(){
    cin >> n >> m;
    for(int i = 1; i <= m; i++) {
        cin >> a[i].u >> a[i].v >> a[i].w;
    }
    for(int i = 1; i <= n; i++)
        fa[i] = i;
    sort(a+1, a+m+1, cmp);
    for(int i = 1; i <= m; i++) {
        int u = find(a[i].u), v = find(a[i].v);
        if(u == v) continue;
        fa[u] = v;
        cnt++;
        ans += a[i].w;
        if(cnt == n-1) {
            break;
        }
    }
    if(cnt == n-1) cout << ans;
    else cout << "impossible";
    return 0;
}

Copy

算法证明

原图 G=(V,E)G=(V,E),其中,VV 为点集,EE 为边集。

我们在 EE 中找到边权最小的边,记为 e_{min} = (u,v)emin​=(u,v),选择 uu 从 VV 中剔除,并记 eses 为所有和 uu 连接的边集, V'=V-uV′=V−u,E'=E-esE′=E−es,记。

经过上面处理,我们得到一个删除了结点 uu 的结点数减少了的新图 G'=(V',E')G′=(V′,E′)。

很明显,如果要把 uu 连到 G'G′ 上,从 eses 中任意选一条边加入,均不会形成环,那么,选择 e_{min}emin​ 必然是最优的。

如此,在 GG 上求最小生成树的问题就可以拆成两步解决:

  1. 在 G'G′ 求最小生成树(和原问题相似,规模更小)
  2. 如此就把原规模为 NN 的问题降为规模为 N-1N−1 的问题,而该问题和原问题相似,规模更小,如此反复处理,直至 N=1N=1 即可,把这个过程中选择的边合并即构成原图的最小生成树。

时间复杂度分析

排序:O(E\log E)O(ElogE),采用并查集选边合并:O(E\alpha (V))O(Eα(V)),总时间复杂度:O(E\log E)O(ElogE)文章来源地址https://www.toymoban.com/news/detail-473943.html

到了这里,关于Kruskal算法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 算法思想—枚举、递推、迭代、递归、分治、贪心、动态规划、回溯、模拟、分支定界

    算法思想 枚举(暴力算法) 枚举算法(暴力算法)是一种通过逐一尝试所有可能解来解决问题的算法。它的基本思想是将问题的所有可能答案一一列举出来,并根据一定的判断条件来确定哪些答案是合适的。这种算法通常使用循环来实现,因为需要尝试所有可能的情况。两

    2024年02月01日
    浏览(27)
  • 【LeetCode刷题篇零】一些基础算法知识和前置技能(上)

    冒泡排序 冒泡的核心是两两比较,大数下沉,小数上浮,比较的轮数是数组的长度 N,每一轮比较的次数为 N - 当前轮的索引: 外层循环控制轮数 round: [1,N] 内层循环控制次数 i: [0,N - round) 在每一轮当中,内循环中两两比较相邻的两个数,大数下沉(交换),如果某一轮没

    2024年02月07日
    浏览(34)
  • 【数据结构与算法分析】使用C语言实现队列的两种(带头结点与不带头结点)链式存储,并且给出一种循环队列的设计思想

      当我们编写程序时,经常需要处理各种数据结构。队列是一种常见的数据结构,它有着广泛的应用场景。队列的基本操作包括入队和出队,应用于模拟等待队列、消息队列、计算机缓存等场合。   在实际编程中,我们可以用不同的数据结构来实现队列。本文主要介绍了

    2024年02月08日
    浏览(47)
  • 图论基础知识 并查集/例题

    学习记录自代码随想录 并查集常用来解决连通性问题。 判断两个元素是否在同一个集合里的时候,要想到用并查集。 并查集主要有两个功能: 1.将两个元素添加到一个集合中; 2.判断两个元素在不在同一个集合。 例题:20240410 Huawei机考

    2024年04月25日
    浏览(27)
  • JUC前置知识

    JUC概述 在开发语言中,线程部分是重点,JUC是关于线程的。JUC是java.util.concurrent工具包的简称。这是一个处理线程的工具包,JDK1.5开始出现的。 线程和进程 线程和进程的概念 进程(process): 是计算机的程序关于某数据集合上的一次允许活动,是操作系统进行资源分配和任务调

    2024年02月08日
    浏览(34)
  • 7.前置知识3:LoadBalance

    https://medium.com/google-cloud/understand-cloud-load-balancer-like-a-senior-engineer-d4f55f3111fc 负载均衡本来是个硬件设备。其实一开始确实是的,然而现在已经不同了。 尤其是云厂商提供的负载均衡方案几乎全部是靠软件。现在的负载均衡不仅是网络流量复杂均衡,几乎所有的平衡多个计算资

    2024年02月20日
    浏览(32)
  • (一) AIGC了解+前置知识

    大论文双盲意见还没回来,每天度日如年,慌的一批,唯恐延毕,得找点事情干~ 小论文major revision,本来打算一鼓作气把小论文完全改好的,但是搞了三个月的文字工作,好久没有吸收新知识了 所以…每天边学新东西,边改小论文~ 最近AIGC比较火,就从它开始吧 AIGC大致了解

    2024年02月13日
    浏览(22)
  • C#代码审计实战+前置知识

    菜鸟教程:https://www.runoob.com/csharp/csharp-intro.html C# 基于 C 和 C++ 编程语言,是一个简单的、现代的、通用的、面向对象的编程语言,它是由微软(Microsoft)开发的,由 Ecma 和 ISO 核准认可的。 C# 是由 Anders Hejlsberg 和他的团队在 .Net 框架开发期间开发的。 C# 是专为公共语言基础

    2024年02月05日
    浏览(33)
  • 前置知识——Linux网络虚拟化

    信息是如何通过网络传输被另一个程序接收到的? 我们讨论的虚拟化网络是狭义的,它指容器间网络。 好了,下面我们就从 Linux 下网络通信的协议栈模型,以及程序如何干涉在协议栈中流动的信息来开始了解吧。 如果抛开虚拟化,只谈网络的话,那我认为首先应该了解的知

    2023年04月12日
    浏览(40)
  • 第一章设计模式前置知识

    软件设计模式(Software Design Pattern),又称设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。它描述了在软件设计过程中的一些不断重复发生的问题,以及该问题的解决方案。也就是说,它是解决特定问题的一系列套路,是前辈们的代码

    2024年02月01日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包