数据结构---并查集

这篇具有很好参考价值的文章主要介绍了数据结构---并查集。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

为什么会有并查集

这里可以使用生活中的一个例子来带着大家理解并查集,大家在上学的过程中肯定会发现一种现象,在开学之前大家谁也不认识谁每个人都是一个小团体,可是开学之后因为座位旁边有一个同桌,所以开学没多久你和同桌就会互相认识并且开心的玩在一起,那么这时就是两个一个人的小团体融合成为了一个两个人的小团体,后来你可能会经常把头朝向后面看从而认识了你后面的人,经过了解之后你又跟你后桌的人相互认识从而带着你的同桌和他们玩在一起,那么这个时候两个两人的小团体就会融合成为一个4人的小团体,随着时间的流逝,不同人数的团体相互融合,最终一个班级的人从每个人都是一个小团体变成了一个所有人在一起成为一个大团体,那么为了描述不同团体进行融合的过程就有了查并集这个数据结构。

并查集的原理

我们先来看看并查集的比较官方的定义:在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-findset)。并查集是一个森林,所谓的森林就是指由多个树组成,比如说某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3,4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中数字的绝对值代表:该小集体中具有成员的个数,那么这个数组就如下:
数据结构---并查集,c++详解,数据结构,算法,leetcode
毕业后学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,那么这个时候他们由一个人一个团体合并成为多个人一个团体,于是西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分队s3={2,3,5},10个人形成了三个小团体。假设右三个0,1,2担任队长,那么当前的结构就应该变成下面这样:
数据结构---并查集,c++详解,数据结构,算法,leetcode
三个团体就是三个树,这三个树再构成一个森林,那么这里就有个问题我们如何把这三个树组合成为一个森林呢?答案是使用数组来对这些树进行合并,数组的下标对应着元素,下标对应的值就表示着不同元素之间的关系,如果你是根节点那么你下标对应的值就表示你这个树里面的节点个数,如果你是子树根节点或者子节点的话,那么你下标对应的值就是你父节点在数组中所在的位置,比如说元素0是西安这个树的根节点,元素0对应在数组中的下标为0,那么下标0中记录的数据就为-4表示西安这个树里面有4个节点,再比如说元素5对应的下标是5,那么在数组中下标5里面记录的数据就是2,表示当前的节点为子节点该节点的父节点在数组中的位置为5,那么其他节点也是依次类推,所以上面的数组就会变成下面这个样子:
数据结构---并查集,c++详解,数据结构,算法,leetcode
知道了如何表示多棵树之后我们就来看看如何将两个树合并成为一棵树,比如说将上面的西安和成都进行合并那么我们就可以通过修改成都树中根节点的父节点,让其指向西安树的根节点来实现,那么这里的图片就变成下面这样:
数据结构---并查集,c++详解,数据结构,算法,leetcode
然后在数组中我们就得修改两个树的根节点所对应下标的值,首先将下标为1的值修改成为0表示节点1的父节点为0,将下标为0的值修改成为-7因为融合了一个新的树所以当前树中节点的个数就变多了,那么当前吧数组中的内容就变成下面这样,红色背景表示不同树的根节点,红色从原来的3个变成了2个,那么这就说名当前的森林只有两个树
数据结构---并查集,c++详解,数据结构,算法,leetcode
知道了森林的表示方法和树融合的原理之后我们就可以来模拟实现并查集。

模拟实现并查集

准备工作

首先类里面得存在一个整型数组用来表示每个元素之间的关系:

class UnionFindSet
{
public:

private:
	vector<int> _ufs;//用来表示元素之间的关系
};

但是这样做就会存在一个问题:我们怎么知道数组中的下标对应的是哪个元素呢?所以我们还得创建一个vector容器来方便我们查找下标所对应的元素,又因为元素可以是各种类型所以这里我们得添加一个类模板,模板中存在一个参数表示当前并查集处理的是哪种类型数据的关系,有了这个容器之后我们可以查看下标所对应的元素,那如果我们想查看元素对应的下标又该如何解决呢?所以我们还得创建一个map容器来记录每个元素所对应的下标,那么当前的代码就成为了下面这样:

template<class T>
class UnionFindSet
{
public:

private:
	vector<int> _ufs;//用来表示元素之间的关系
	vector<T> _a;//根据下标找元素
	map<pair<T, int>> _indexmap;//根据元素找到下标
};

构造函数

构造函数需要两个参数,一个参数接收当前容器需要处理的数据数组,另外一个参数表示当前处理的数据个数:

UnionFindSet(const T* sorce, size_t num)
{

}

然后我们就创建一个循环,在循环里面分别取参数数组的值将其插入到数组_a里面,因为循环是从0开始并且数组_a也是从下标为0的位置开始插入,所以在循环里面我们可以顺便往_indexmap容器种插入数据,那么这里的代码就如下:

UnionFindSet(const T* sorce, size_t num)
{
	for (size_t i = 0; i < num; i++)
	{
		_a.push_back(sorce[i]);
		_indexmap[sorce[i]] = i;
	}
}

最后将容器_ufs的长度扩容到num,并将每个元素的值都初始化为-1,那么完整的代码就如下:

UnionFindSet(const T* sorce, size_t num)
	:_ufs(num,-1)
{
	for (size_t i = 0; i < num; i++)
	{
		_a.push_back(sorce[i]);
		_indexmap[sorce[i]] = i;
	}
}

我们可以使用下面的代码来进行以下测试:

int main()
{
	string s1[] = { "张三","李四","王五","赵六" };
	UnionFindSet<string> uf(s1, 4);
	return 0;
}

通过调试我们便可以看到这个容器里面的内容如下:
数据结构---并查集,c++详解,数据结构,算法,leetcode
因为我们没有做出任何的合并操作所以ufs数组里面每个元素的值都是-1,_a数组里面记录的是下标所对应的元素,0对应的是张三,1对应的是李四,2对应的是王五,3对应的是赵六,然后_indexmap里面就记录的是元素对应的下标,经过仔细的对比可以看到里面记录的内容和数组中的内容相对应,那么我们的构造函数就实现完成了,接下来来看查找函数。

FindRoot

FindRoot函数就查找一个元素的根节点,如果一个节点不为根节点那么在数组里面它存储的就是它的父节点的下标,如果一个节点为根节点那么它存储的就是当前树种含有节点的个数的赋值,所以在函数里面我们可以创建一个while循环在循环里面一直提取数组中记录的下标,直到下标对应的值为负数位置,那么这里的代码就如下:

size_t FindRoot(T tmp)
{
	int x = _indexmap.find(tmp)->second;
	while (_ufs[x] >= 0)
	{
		x = _ufs[x];
	}
	return x;
}

Union

传递两个元素给Union函数,那么该函数就能将两个元素所在的树进行合并,在函数的开始我们先判断一下这两个元素所在树的根节点是否相同,如果相同如果不相同的话我们就进行合并,那么这里的代码就如下:

void Union(T tmp1, T tmp2)
{
	size_t x1 = FindRoot(tmp1);
	size_t x2 = FindRoot(tmp2);
	if (x1 != x2)
	{
	//根节点不相等才进行合并
	}
}

合并的过程很简单将某个根节点的值加到另外一个根节点上,然后将值更改成为另外一个根节点的下标即可,那么这里的代码就如下:

void Union(T tmp1, T tmp2)
{
	size_t x1 = FindRoot(tmp1);
	size_t x2 = FindRoot(tmp2);
	if (x1 != x2)
	{
	//根节点不相等才进行合并
		_ufs[x1] += _ufs[x2];
		_ufs[x2] = x1;
	}
}

SetCount

这个函数的功能就是统计当前容器里面存在几棵树,那么这里我们直接通过循环遍历数组_ufs,里面存在几个元素为负数的节点就说明当前容器里面存在几棵树,那么这里的代码就如下:

size_t SetCount()
{
	size_t num = 0;
	for (auto ch : _ufs)
	{
		if (ch < 0)
		{
			num++;
		}
	}
	return num;
}

并查集实战

题目一:省份数量

题目详细:
数据结构---并查集,c++详解,数据结构,算法,leetcode
题目链接->点击此处尝试做题

题目解析

有了并查集之后做这种题简直就是小菜一碟,首先题目给了我们一个二维数组,这个数组里面表示各个城市之间的相连接情况,如果isConnected[0][1]等于1,那么这就表示1号城市和2号城市相联通,然后把一群相互联接的城市称为省份,最后题目要求我们根据一个二维数组来判断当前存在多少个省份,那么这里我们就可以先创建一个并查集对象,然后创建一个内嵌for循环判断二维数组中相互链接的城市,如果一个第i号城市和第j号城市相互连接的话就使用并查集对这两个城市进行合并,遍历完成之后就可以返回并查集中的SetCount函数来结束本题,因为题目传递的参数是一个vector<vector<int>>的容器,而我们上面实现的并查集的构造函数需要一个数组,所以为了方便我们对上面的类进行简化,让其专门服务于int类型的数据那么这里的代码如下:

class UnionFindSet
{
public:
	UnionFindSet(int size)
		: _set(size, -1)
	{}

	size_t FindRoot(int x)
	{
		while(_set[x] >= 0)
			x = _set[x];

		return x;
	}

	void Union(int x1, int x2)
	{
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);

		if(root1 != root2)
		{
			_set[root1] += _set[root2];
			_set[root2] = root1;
		}
	}

	size_t SetCount()
	{
		size_t count = 0;
		for(size_t i = 0; i < _set.size(); ++i)
		{
			if(_set[i] < 0)
				count++;
		}

		return count;
	}

private:
	std::vector<int> _set;
};

然后这道题的代码就如下:

int findCircleNum(vector<vector<int>>& isConnected) {
    UnionFindSet uf(isConnected.size());
    for(int i=0;i<isConnected.size();i++)
    {
        for(int j=0;j<isConnected[0].size();j++)
        {
            if(i!=j&&isConnected[i][j]==1)
            {
                uf.Union(i, j);
            }
        }
    }
    return uf.SetCount();
}

测试的结果如下:
数据结构---并查集,c++详解,数据结构,算法,leetcode
可以看到运行的结果是正确的。

题目二:等式方程的可满足性

数据结构---并查集,c++详解,数据结构,算法,leetcode
题目链接->点击此处尝试做题

题目解析

这道题很明显也是使用并查集进行解决,数组中提供很多表达式,那么我们首先创建一个for循环将表达式中所用相等的元素都合并到一起,然后再创建一个循环判断每个不相等的表达式看两遍的元素是否属于同一个树,如果是树的话就直接返回false,如果不属于同一个树的话就接着往下进行判断,如果所有元素都判断完并且没有出错的话就返回true,题目给的参数形式如下:

bool equationsPossible(vector<string>& equations) {

}

我们不知道元素个数,所以这里直接将空间拉到最大一共有26个因为字母,那么这里就开26个大小,然后使用相对映射法进行合并字符a对应的是0,字符b对应的是1这样一直往后,那么这里的代码就如下:

bool equationsPossible(vector<string>& equations) {
	UnionFindSet uf(26);
	for(auto ch:equations)
	{
	    if(ch[1]=='=')
	    {
	        uf.Union(ch[0]-'a', ch[3]-'a');
	    }
	}
	for(auto ch:equations)
	{
	    if(ch[1]=='!')
	    {
	        if(uf.FindRoot(ch[0]-'a')==uf.FindRoot(ch[3]-'a'))
	        {
	            return false;
	        }
	    }
	}
	return true;
	}

代码的运行结果如下:
数据结构---并查集,c++详解,数据结构,算法,leetcode
可以看到运行的结果是正常的。文章来源地址https://www.toymoban.com/news/detail-615904.html

到了这里,关于数据结构---并查集的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【数据结构】--并查集

    目录 一、概念 ​编辑 二、应用场景--“连接”问题(属于同一Qu 三、实现思路  四、如何存储数据 五、定义接口 1.初始化(init) 2.其他 isSame() 六、抽象类 六、Quick Find【v1 所在集合的所有元素都指向 v2 的根节点】 1.Union 1.Union图解 2.注意点:  3.代码实现 2.find  1.find图

    2023年04月09日
    浏览(33)
  • 【数据结构】并查集

    并查集是简单的数据结构,学会并查集,为图打好基础。 是树状的数据结构,用于处理相交集合的合并与查询 通常用森林表示,一片森林表示一个集合 并查集一般需要完成 查找元素属于哪个集合 查看两个元素是否属于同一个集合 将两个集合归并成一个集合 集合的个数 假

    2024年02月19日
    浏览(36)
  • 【高阶数据结构】——并查集

    在一些应用问题中, 需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合, 然后按一定的规律将归于同一组元素的集合合并 。在此过程中要 反复用到查询某一个元素归属于那个集合的运算 。适合于描述这类问题的抽象数据类型称为 并查集

    2024年02月16日
    浏览(37)
  • 数据结构--并查集

    所有元素的全集s 将各个元素划分为若干个互不相交的子集 用一个数组S[ ]即可表示“集合”关系 集合的两个基本操作―— “并” color{red}“并” “ 并 ” 和 “查” color{red}“查” “ 查 ” Find -—“查”操作:确定一个指定元素所属集合 Union --“并”操作:将两个不想交的集

    2024年02月15日
    浏览(36)
  • 高阶数据结构 ——— 并查集

    并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。 并查集通常用森林来表示,森林中的每棵树表示一个集合,树中的结点对应一个元素。 说明一下: 虽然利用其他数据结构也能完成不相交集合的合并及查询,但在数据量极大的情况下,其耗费的时

    2024年02月03日
    浏览(54)
  • 数据结构详细笔记——并查集

    集合:将各个元素划分为若干个互不相交的子集的集合 森林是m(m=0)棵互不相交的树的集合 优化思路:在每次Union操作构建树的时候,尽可能让树不长高 ①用根结点的绝对值表示树的结点的总数 ②Union操作,让小树合并到大树 优化思路:先找到根结点,再将查找路径上所有结

    2024年02月06日
    浏览(38)
  • 数据结构之并查集

    并查表原理是一种 树型的数据结构 ,用于处理一些不相交集合的合并及查询问题。并查集的思想是用一个数组表示了整片森林(parent),树的根节点唯一标识了一个集合,我们只要找到了某个元素的树根,就能确定它在哪个集合里。这类问题的抽象数据类型称为并查集(uni

    2024年02月12日
    浏览(37)
  • 【数据结构】| 并查集及其优化实现

    以一个直观的问题来引入并查集的概念。 亲戚问题:有一群人,他们属于不同家族,同一个家族里的人互为亲戚,不同家族的人不是亲戚。随机指定两个人,问他们是否有亲戚关系。 以下图3个不相交的集合表示 3 个家族,当询问两个人是否有亲戚关系时,也就是问两个元素

    2024年02月09日
    浏览(39)
  • 计算机基础--->数据结构(9)【并查集】

    并查集是一种用于解决集合合并和查询问题的数据结构,主要用于实现有关集合的操作,它有两种主要操作,合并(union)和查找(find)。 查找(Find):用来确定元素属于哪个集合。它接受一个元素作为参数,并返回这个元素所属集合的代表元素。通过查找操作,可以判断

    2024年02月15日
    浏览(49)
  • Java高阶数据结构 & 并查集 & 最小生成树

    并查集与最小生成树 1.1 并查集的原理 在一些应用问题中,我们常常会遇到一类问题 一开始是一个人 后来新增的人可能与这个人有关系,也可能与这个人无关系。 一个人与一个人有关系,这个人与另一个人也有关系,那么三人都有关系。 有关系的和没关系的之间是不同的类

    2024年02月03日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包