【C语言】一篇让你彻底吃透（结构体与结构体位段）

这篇具有很好参考价值的文章主要介绍了【C语言】一篇让你彻底吃透（结构体与结构体位段）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

本章重点
主要讲解结构体和位移动的使用和定义与声明，并且结构体和位段在内存中是如何存储的。

结构体

结构体类型的声明

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

例如用结构体描述一个学生：

struct Stu
{
    //结构体成员变量
   char name[20];//名字
   int age;//年龄
   char sex[5];//性别
   char id[20];//学号
}; //分号不能丢

struct 结构体关键字

stu结构体标签 (标签可以自己随便起)

struct stu - 结构体类型

结构的成员可以是标量、数组、指针，甚至是其他结构体。

结构体特殊的声明

在声明结构的时候，可以不完全的声明，但是这样只能调用一次。

匿名结构体类型

只能调用一次，因为没有结构体标签

//匿名结构体类型  
struct
{
	int a;
	char b;
	float c;
}x; //（但是这样写只能调用一次x，因为没有结构体标签）

结构体变量的定义和初始化

有了结构体类型，那如何定义变量和初始化呢，其实很简单。

结构体定义:

struct stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}s1,s2,s3;    全局变量的定义

struct stu s4;  全局变量的定义

int main()
{
	struct stu s5;  局部变量定义
	struct stu s6;  局部变量定义
	return 0;
}

如果结构体名字过长，我们也可以typedef一下，但是typedef时注意，想在此地方加全局变量是不允许的，如果此时想要创造全局变量应该像上代码s4一样创造。

结构体初始化

struct stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}s1 = { "wangwu",25,"sex","2022333" }; 

struct stu s1 = { "lihua",18,"sex","2022111" }; //全局变量的初始化

int main()
{
	struct stu s2 = { "lisi",20,"sex","2022222" };//局部变量初始化

	return 0;
}

结构体成员的访问

结构体变量如何访问成员？

结构变量的成员是通过点操作符（.）访问的。点操作符接受两个操作数。
结构变量的成员也可以通过->箭头来访问。

那（.）和->到底使用那个呢？

点（.）是用于结构体变量访问成员

箭头（->）是用于结构体指针访问成员。

点（.）是用于结构体变量访问成员

#include<stdio.h>
struct stu
{

	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号

};

void test1(struct stu q1)
{
	//通过 . 来访问
	printf("%s\n", q1.name);
	printf("%d\n", q1.age);
	printf("%s\n", q1.sex);
	printf("%s\n", q1.id);
}

int main()
{
	struct stu s1 = { "lisi",20,"sex","2022222" };//局部变量初始化
	test1(s1);
	
	return 0;
}

箭头（->）是用于结构体指针访问成员。

#include<stdio.h>
struct stu
{

	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号

};

void test2(struct stu* q1)
{
	//通过 . 来访问
	printf("%s\n", q1->name);
	printf("%d\n", q1->age);
	printf("%s\n", q1->sex);
	printf("%s\n", q1->id);
}

int main()
{
	struct stu s1 = { "lisi",20,"sex","2022222" };//局部变量初始化
	test2(&s1);

	return 0;
}

结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？

答案是可以的。

但是必须写成指针的形式。如果写成以下这样是错误的，会一直套娃下去，根本不知道该结构体大小是多少

错误的写法

struct Node
{
	int data;
	struct Node next;
};

正确的写法应该写成指针的形式

struct Node
{
	int data;
	struct Node* next;
};

结构体内存对齐

我们已经掌握了结构体的基本使用了。
现在我们深入讨论一个问题：计算结构体的大小。

看看以下代码输出的是什么

struct S1
{
	int a;
	char c;
};

int main()
{
	int ret = sizeof(struct S1);
	printf("%d\n", ret);
	return 0;
}

很多人一开始以为是5，但并不是的。
答案是8，那为什么呢，这就与结构体内存对齐相关了

如何计算结构体内存？

首先得掌握结构体的对齐规则：

.结构体的第一个成员永远都放在0偏移处

从第二个成员开始，以后的每个成员都要对齐到某个（对齐数）的整数倍地址处.(取对齐数较小值)
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。 -
备注：
VS 环境下默认对齐数是8
gcc 环境下没有默认对齐数，没有默认对齐数时，对齐数就是成员自身的大小

当成员全部存放进去后, 结构体的总大小必须是，所有成员的对齐数中最大对齐数的整数倍如果不够，则浪费空间对齐.

如果嵌套了结构体，嵌套的结构体成员要对齐到自己成员的最大对齐数的整数倍处,整个结构体的大小，必须是最大对齐数的整数倍，最大对齐数包含中嵌套的结构体成员中的对齐数

我们直接上练习理解

练习 1 （sizeof（struct S1）输出结果是什么）

struct S1
{
  char c1;
  int i;
  char c2;
};
printf("%d\n", sizeof(struct S1));

答案是->12

【C语言】一篇让你彻底吃透（结构体与结构体位段）

练习 2 （sizeof（struct S2）输出结果是什么）

struct S2
{
 char c1;
 char c2;
 int i;
};
printf("%d\n", sizeof(struct S2));

答案是->8

【C语言】一篇让你彻底吃透（结构体与结构体位段）

练习 3（sizeof（struct S3）输出结果是什么）

struct S3
{
 double d;
 char c;
 int i;
};
printf("%d\n", sizeof(struct S3));

答案是->16

【C语言】一篇让你彻底吃透（结构体与结构体位段）

练习4-结构体嵌套问题,以下输出的是什么

struct S3
{
	int d;
	char c;
	int i;
};

struct S4
{
	char c1;
	struct S3 s3;
	int d;
};
printf("%d\n", sizeof(struct S4));

答案是20

【C语言】一篇让你彻底吃透（结构体与结构体位段）

为什么存在内存对齐?

大部分的参考资料都是如是说的：

平台原因(移植原因)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到：

让占用空间小的成员尽量集中在一起。

//例如：
struct S1
{
	char c1;
	int i;
	char c2;
};
struct S2
{
	char c1;
	char c2;
	int i;
};

S1和S2类型的成员一模一样，但是S1和S2所占空间的大小有了一些区别。

s1 内存是12个字节
s2 内存是8个字节

结构体传参

struct S
{
	int data[1000];
	int num;
};
struct S s = { {1,2,3,4}, 1000 };

//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}

//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}

int main()
{
	print1(s);   //传结构体
	print2(&s); //传地址
	return 0;
}

上面的 print1 和 print2 函数哪个好些？

答案是：首选print2函数。

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。
如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

结论：

结构体传参的时候，要传结构体的地址。

位段

结构体讲完就得讲讲结构体实现位段的能力。

什么是位段

有些数据在存储时并不需要占用一个完整的字节，只需要占用一个或几个二进制位即可。为了充分利用好内存空间，C语言又提供了一种叫做位段的数据结构

位段能够减少储存数据的位数
信息的存取一般以字节为单位

位段的声明和结构是类似的，有两个不同：

位段的成员必须是 int、unsigned int 或signed int 。

位段的成员名后边有一个冒号和一个数字。

: 后面的数字用来限定成员变量占用的位数

在结构体定义时，指定某个成员变量所占用的是二进制位数（Bit）

例如：

struct A
{
  int _a:2;
  int _b:5;
  int _c:10;
  int _d:30;
};

他们虽然是int类型，在内存占32个比特位，但是位段限制了他们所占的空间，比如a只能占2个bit，b占5个bit，c占10个bit位，d占10个bit位。

A就是一个位段类型。
那位段A的大小是多少？

printf("%d\n", sizeof(struct A));
答案是->8 ，为什么呢？那就关于位段的内存分配了。s

位段的内存分配

位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型

位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};
int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	system("pause");
}

改代码内存空间是如何开辟的！？图解：
【C语言】一篇让你彻底吃透（结构体与结构体位段）

【C语言】一篇让你彻底吃透（结构体与结构体位段）

总结：

vs 分配到的内存中的比特位是由右向左使用

分配的内存剩余的比特位不够使用时，浪费掉

位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。

位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。

位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。

当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的