树与二叉树
树的基本概念
树的定义
-
树是n(n >=0)个节点的有限集。当n=0 时,称为空树
-
在任意一棵非空树中应满足
- 有且仅有一个特定的称为根的结点
- 当n>1 时,其余节点可分为m(m>0) 个互不相交的有限集T1,T2……Tm,其中每个集合本身又是一棵树,并且称为根的子树
-
树是一种逻辑结构,也是一种分层结构
- 树的根结点没有前驱,除根结点外的所有结点有且只有一个前驱
- 树中所有结点可以有零个或多个后继
基本术语
-
图5.1树的树形表示
-
考虑结点K
- K的祖先:根A到结点K的唯一路径上的任意结点
- 子孙:结点B是结点K的祖先,而结点K是结点B的子孙
- 双亲与孩子:路径上最接近结点K的结点E称为K的双亲,而K为结点E的孩子
- 兄弟:有相同双亲的结点称为兄弟,如结点K和结点L有相同的双亲E,即K和L为兄弟
-
结点的度:树中一个结点的孩子个数,树中结点的最大度数称为树的度
-
分支结点:度大于0的结点
-
叶子结点(又称终端结点):度为0(没有子女结点)的结点
-
结点的层次:从树根开始定义,根结点为第1层,它的子结点为第2层,以此类推
-
结点的深度:从根结点开始自顶向下逐层累加的
-
结点的高度:从叶结点开始自底向上逐层累加的
-
树的高度(或深度):树中结点的最大层数
-
有序树和无序树:树中结点的各子树从左到右是有次序的,不能互换,称该树为有序树,否则称为无序树
-
路径和路径长度:树中两个结点之间的路径是由这两个结点之间所经过的结点序列构成的,而路径长度是路径上所经过的边的个数
-
森林:森林是n棵互不相交的树的集合
- 只要把树的根结点删去就成了森林
- 给m棵独立的树加上一个结点,并把这m棵树作为该结点的子树,则森林就变成了树
树的性质
-
树中的结点数等于所有结点的度数加1
-
度为m 的树中第i层上至多有 m^(i-1)个结点(i>=1)
-
高度为h的m叉树至少有h个结点。
-
高度为h的m 叉树至多有(m^h-1)/(m-1)个结点
-
高度为h、度为m的树至少有h+m-1个结点
-
具有n个结点的m叉树的最小高度为
-
m 叉树——每个结点最多只能有m 个孩子的树
- 任意结点的度≤m ( 最 多m 个孩子)
- 允许所有结点的度都<m
- 可以是空树
-
度为m的树
- 任意结点的度≤m (最多m 个孩子)
- 至少有一个结点度=m ( 有m个孩子)
- 一定是非空树,至少有m+1 个结点
二叉树的概念
二叉树的定义及其主要特性
-
二叉树的定义:二叉树是另一种树形结构,其特点是每个结点至多只有两棵子树,并且二叉树的子树有左右之分,其次序不能任意颠 倒
-
二叉树与度为2的有序树的区别
-
度为2的树至少有3个结点,而二叉树可以为空
-
孩子结点
- 度为2的有序树的孩子的左右次序是相对于另一孩子而言的,若某个结点只有一个孩子,则这个孩子就无须区分其左右次序
- 二叉树无论其孩子数是否为2,均需确定其左右次序
-
-
特殊的二叉树
-
满二叉树
-
一棵高度为h,且含有2^h-1个结点的二叉树称为满二叉树
-
对于编号为i的结点
- 双亲结点i/2向下取整
- 若有左孩子,则左孩子为2i
- 若有右孩子,则右孩子为2i+1
-
-
完全二叉树
-
高度为h、有n个结点的二叉树,当且仅当其每个结点都与高度为h的满二叉树中编号为1~n 的结点一一对应时,称为完全二叉树
-
特点
- 叶子结点只可能在层次最大的两层上出现。对于最大层次中的叶子结点,都依次排列在该层最左边的位置上
- 若有度为1的结点,则只可能有一个,且该结点只有左孩子而无右孩子(重要特征)
- 按层序编号后, 一旦出现某结点(编号为i) 为叶子结点或只有左孩子,则编号大于i的结点均为叶子结点
- 若n为奇数,则每个分支结点都有左孩子和右孩子
- 若n为偶数,则编号最大的分支结点(编号为n/2) 只有左孩子,没有右孩子,其余分支结点左、右孩子都有
-
-
二叉排序树
- 左子树上所有结点的关键字均小于根结点的关键字;右子树上的所有结点的关键字均大于根结点的关键字;左子树和右子树又各是一棵二叉排序树
-
平衡二叉树
- 树上任一结点的左子树和右子树的深度之差不超过1
-
-
二叉树的性质
- 非空二叉树上的叶子结点数等于度为2的结点数加1
- 其余性质
二叉树的存储结构
-
顺序存储结构
- 用一组地址连续的存储单元依次自上而下、自左至右存储完全二叉树上的结点元素,即将完全二叉树上编号为i的结点元素存储在一维数组下标为i-1 的分量中
- 完全二叉树和满二叉树采用顺序存储比较合适
- 一般的二叉树,为了能反映二叉树中结点之间的逻辑关系,只能添加并不存在的空结点,让其每个结点与完全二叉树上的结点相对照,再存储到一维数组的相应分量中
-
链式存储结构
- 由于顺序存储的空间利用率较低,因此二叉树一般都采用链式存储结构,用链表结点来存储二叉树中的每个结点
- 在含有n个结点的二叉链表中,含有n+1 个空链域
- 结构描述
typedef struct BiTNode{
ElemType data;
struct BiTNode *lchild,*rchild;
}BiTNode,*BiTree;
二叉树的遍历和线索二叉树
二叉树的遍历
时间复杂度o(n),递归算法和非递归算法的转换:利用栈进行实现
- 先序遍历
- 中序遍历
- 后序遍历
层次遍历
- 利用队列实现,可详见队列的应用
由遍历序列构造二叉树
- 必须有中序遍历
线索二叉树
-
遍历二叉树是以一定的规则将二叉树中的结点排列成一个线性序列,从而得到几种遍历序列,使得该序列中的每个结点(第一个和最后一个结点除外)都有一个直接前驱和直接后继
-
线索二叉树的结点结构
-
中序线索二叉树的构造
-
概念
-
二叉树的线索化是将二叉链表中的空指针改为指向前驱或后继的线索
-
而前驱或后继的信息只有在遍历时才能得到,因此线索化的实质就是遍历一次二叉树
-
-
如需更进一步的了解,请仔细阅读教材,此处暂时仅介绍基本概念
-
树、森林
树的存储结构
-
双亲表示法
- 采用一组连续空间来存储每个结点,同时在每个结点中增设一个伪指针,指示其双亲结点在数组中的位置
- 根结点下标为0,其伪指针域为-1
- 优点 利用了每个结点(根结点除外)只有唯一双亲的性质,可以很快得到每个结点的双亲结点
- 缺点 但求结点的孩子时需要遍历整个结构
-
孩子表示法
- 将每个结点的孩子结点都用单链表链接起来形成一个线性结构,此时n个结点就有n个孩子链表(叶子结点的孩子链表为空表)
- 优点 寻找于女的操作非常直接
- 缺点 寻找双亲的操作需要遍历n个结点中孩于链表指针域所指向的n个孩子链表
-
孩子兄弟表示法
- 以二叉链表作为树的存储结构,孩子兄弟表示法使每个结点包括三部分内容:结点值、指向结点第一个孩子结点的指针,及指向结点下一个兄弟结点的指针
- 优点 这种存储表示法比较灵活,其最大的优点是可以方便地实现树转换为二叉树的操作,易于查找结点的孩子等
- 缺点 从当前结点查找其双亲结点比较麻烦
树、森林与二叉树的转换
-
树转换为二叉树的规则
- 每个结点左指针指向它的第一个孩子,右指针指向它在树中的相邻右兄弟
-
树转换成二叉树的画法
- 在兄弟结点之间加一连线
- 对每个结点,只保留它与第一个孩子的连线,而与其他孩子的连线全部抹掉
- 以树根为轴心,顺时针旋转45度
-
森林转换成二叉树的画法
- 将森林中的每棵树转换成相应的二叉树
- 每棵树的根也可视为兄弟关系,在每棵树的根之间加一根连线
- 以第一棵树的根为轴心顺时针旋转45°
-
二叉树转换为森林的规则
- 若二叉树非空,则二叉树的根及其左子树为第一棵树的二叉树形式,故将根的右链断开
- 二叉树根的右子树又可视为一个由除第一棵树外的森林转换后的二叉树
- 应用同样的方法,直到最后只剩一棵没有右子树的二叉树为止,最后再将每棵二叉树依次转换成树,就得到了原森林
-
图5.17 森林与二叉树的对应关系
-
图5.16 树与二叉树的对应关系
树和森林的遍历
- 遍历对应关系
树与二叉树的应用
二叉排序树(BST)
-
二叉排序树的定义
- 1)若左子树非空,则左子树上所有结点的值均小于根结点的值
- 2)若右子树非空,则右子树上所有结点的值均大于根结点的值
- 3)左、右子树也分别是一棵二叉排序树
-
二叉排序树的查找
-
二叉排序树的查找是从根结点开始,沿某个分支逐层向下比较的过程,若二叉排序树非空,先将给定值与根结点的关键字比较
- 若相等,则查找成功
- 若不等,如果小于根结点的关键字,则在根结点的左子树上查找
- 否则在根结点的右子树上查找
-
-
二叉排序树的插入
-
插入结点的过程
- 若原二叉排序树为空,则直接插入结点
- 若原二叉排序树为空,则直接插入结点
- 若关键字k大于根结点值,则插入到右子树
-
-
二叉排序树的构造
- 从一棵空树出发,依次输入元素,将它们插入二叉排序树中的合适位置。设查找的关键字序列为{45,24,53,45,12,24},则生成的二叉排序树如图所示。
- 从一棵空树出发,依次输入元素,将它们插入二叉排序树中的合适位置。设查找的关键字序列为{45,24,53,45,12,24},则生成的二叉排序树如图所示。
-
二叉排序树的删除
- 若被删除结点z是叶结点,则直接删除,不会破坏二叉排序树的性质
- 若结点z只有一棵左子树或右子树,则让z的子树成为z父结点的子树,替代z的位置
- 若结点z有左、右两棵子树,则令z的直接后继(或直接前驱)替代z,然后从二叉排序树中删去这个直接后继(或直接前驱),这样就转换成了第一或第二种情况
-
二叉排序树的查找效率分析
- 二叉排序树的查找效率,主要取决于树的高度
平衡二叉树
-
平衡二叉树的定义
- 在插入和州除二叉树结点时,要保证任意结点的左、右子树高度差的绝对值不超过1,将这样的二叉树称为平衡二叉树
- 平衡因子:左子树与右子树的高度差为该结点的平衡因子 平衡因子的值只可能是-1、0或1
-
平衡二叉树的插入/删除
-
当在二叉排序树中插入(或删除)一个结点时
- 首先检查其插入路径上的结点是否因为此次操作而导致了不平衡
- 若导致了不平衡,则先找到插入路径上离插入结点最近的平衡因子的绝对值大于1的结点A
- 再对以A 为根的子树,在保持二叉排序树特性的前提下,调整各结点的位置关系,使之重新达到平衡
-
规律归纳
-
LL平衡旋转(右单旋转)
-
RR平衡旋转(左单旋转)
-
LR平衡旋转(先左后右双旋转)
-
RL 平衡旋转(先右后左双旋转)
-
-
-
平衡二叉树的查找
- 查找过程同二叉排序树
哈夫曼树和哈夫曼编码
-
哈夫曼树的定义
-
称为哈夫曼树,也称最优二叉树:在含有n个带权叶结点的二叉树中,其中带权路径长度(WPL) 最小的二叉树
-
基本概念
- 结点的带权路径长度:从树的根到任意结点的路径长度(经过的边数)与该结点上权值的乘积
- 树中所有叶结点的带权路径长度之和称为该树的带权路径长度
-
-
哈夫曼树的构造
-
构造过程
- 1)将这n个结点分别作为 n 棵仅含一个结点的二叉树,构成森林 F
- 2)构造一个新结点,从 F中选取两棵根结点权值最小的树作为新结点的左、右子树,并且将新结点的权值置为左、右子树上根结点的权值之和
- 3)从F中删除刚才选出的两树,同时将新得到的树加入F中
- 4)重复骤2)和3),直至F中只剩下棵为止。
-
-
哈夫曼树的特点
- 1)每个初始结点最终都成为叶结点,且权值越小的结点到根结点的路径长度越大
- 2)构造过程中共新建了n-1个结点(双分支结点),因此哈夫曼树的结点总数为2n-1
- 3)每次构造都选择2棵树作为新结点的孩子,因次哈夫曼树中不在度为1的结点。
-
哈夫曼编码
-
基本概念
- 固定长度编码:在数据通信中,若对每个字符用相等长度的二进制位表示
- 可变长度编码:允许对不同字符用不等长的二进制位表示
- 前缀编码:没有一个编码是另一个编码的前缀
-
哈夫曼编码是一种被广泛应用而且非常有效的数据压缩编码文章来源:https://www.toymoban.com/news/detail-835051.html
-
构造哈夫曼编码文章来源地址https://www.toymoban.com/news/detail-835051.html
- 即每个结点按哈夫曼树路径(0左1右)的规则编码
-
红黑树
- 每个结点或是红色,或是黑色的。
- 根结点是黑色的。
- 叶结点 (虚构的外部结点、NULL 结点)都是黑色的。
- 不存在两个相邻的红结点(即红结点的父结点和孩子结点均是黑色的)。
- 对每个结点,从该结点到任意一个叶结点的简单路径上,所含黑结点的数量相同。
并查集
- 并查集操作
到了这里,关于数据结构--树与二叉树的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!