[Linux] Linux文件系统

这篇具有很好参考价值的文章主要介绍了[Linux] Linux文件系统。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

🥁作者华丞臧.
📕​​​​专栏:【LINUX】
各位读者老爷如果觉得博主写的不错,请诸位多多支持(点赞+收藏+关注)。如果有错误的地方,欢迎在评论区指出。



一、Linux文件系统

1.1 磁盘

信息化时代就是信息产生价值的时代,信息化是当今时代发展的大趋势,代表着先进生产力。通常我们都会将信息存放在某些硬件上,如:硬盘、内存等;当信息存放硬盘上时,信息就变成了硬盘上的文件,人们通过一些设备如电脑手机可以查看使用这些数据,我们的工作和生活,已经完全离不开视频、音乐、图片、文本、表格这样的数据文件。

  • 磁盘上存放着大量的文件,这些文件需要被管理组织起来,操作系统中管理和存储文件信息的软件机构称为文件系统。
  • 最开始存放数据的硬件是磁盘,随着时代发展,像我们的笔记本电脑大多使用SSD硬盘,但是磁盘还是主要的存储设备,可以用存放大量的数据,关键是便宜。
  • 下图是一张磁盘的结构图,磁盘的核心就是这些盘面,盘面能够记录二进制序列,其原理就是通过电流产生感应磁场来改变某些特定位置的磁极从而将电信号持久化到磁盘上。

[Linux] Linux文件系统

  • 磁盘工作时是处于一种高速旋转的状态,磁头依靠磁盘的高速旋转引起的空气动力效应悬浮在盘面上,磁头在副轴马达的带动下可以在极短的时间内精确的切换到数据所在的磁道。

  • 磁盘是一种高精度的设备,在高速旋转的情况下,磁面上的一粒灰尘都可能会导致磁盘损坏,因此磁盘通常是在无尘的环境下密封。

  • 每一个盘面都对应一个磁臂,通过这些磁臂上的磁头来定位数据的位置,依次确定磁道(柱面)、盘面、以及扇区,这三个值称为CHS地址。
    [Linux] Linux文件系统

  • 扇区是硬盘的最小操作单位,但扇区对于操作系统来说还是太小了,一般操作系统有自己的硬盘操作最小单位,在linux下一般为4k。
    [Linux] Linux文件系统

  • 为了方便管理数据,我们可以将硬盘这样的物理块设备,分割成多个逻辑块设备。或者,我们也可以将多个物理块设备,组合成一个容量更大的逻辑块设备。

  • 操作系统需要管理磁盘,将磁盘抽象为一个线性的结构,类似于卷尺拉出来是线性的收进去是圆形的,因此我们可以将磁盘想象成线性的结构数组,对磁盘的管理就可以转换成对数组空间的管理了。

  • 假设磁盘抽象的出的数组为sector disk[100000000],那么我们定位一个扇区只需要数组的下标即可(这种下标称为LBA–逻辑块地址),将LBA转换成CHS地址,再将数据写入对应的磁盘上去。
    [Linux] Linux文件系统

  • 磁盘上存储的基本单位是扇区(512字节常规),文件系统访问磁盘的基本单位是4KB,即一次IO访问8个扇区。

  • 这样做有两个好处:一、提高IO的效率二、让软件(OS)和硬件(磁盘)具有强相关性即解耦合

1.2 inode

使用ll查看文件,除了文件名还可以看到文件的其他属性,如下图:
[Linux] Linux文件系统
每行包含7列:

  • 模式:代表文件的类型以及权限
  • 硬链接数
  • 文件所有者
  • 所属组
  • 文件大小
  • 最后修改时间
  • 文件名

如果需要查看文件更详细的信息可以使用stat命令,如下图:
[Linux] Linux文件系统
在上图中我们可以看到文件属性中有一个Inode字段,在Linux系统中inode用于表示唯一的一个文件。

  • 不管是在Windows平台还是在Linux系统中,我们都可以通过绝对路径或相对路径找到一个唯一的文件,前提是在同一目录下都不允许重名的文件出现。
  • 文件是存放在磁盘上的,不管是普通文本文件还是文件夹(Linux上通常称为目录)都属于文件的一种,目录也是文件;在这种情况下,操作系统如何在磁盘上查找到目标文件的呢 —— 给定一个一对一的映射关系。

Linux ext2文件系统,下图为磁盘一个分区的文件系统图(内核内存映像肯定有所不同),磁盘是典型的块设备,硬盘分区被划分为一个个的block。一个block的大小是由格式化的时候确定的,并且不可以更改。例如mke2fs的-b选项可以设定block大小为1024、2048或4096字节。而下图中启动块(Boot Block)的大小是确定的。

[Linux] Linux文件系统

  • 启动块(Boot Block):里面包含操作系统的位置以及分区表,开机信息。
  • Block Group :ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。
  • 超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:bolck 和 inode的总量,未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个文件系统结构就被破坏了,因此超级快通常会备份一定数量。
  • GDT(Group Descriptor Table) :块组描述符,描述块组属性信息,记录inode数、起始inode编号、block使用量以及剩余量等等信息。
  • 块位图(Block Bitmap):Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用。
  • inode位图(inode Bitmap):每个bit表示一个inode是否空闲可用。
  • i节点表(inode table):以128字节为单位,存放文件属性 如 文件大小,所有者,最近修改时间等。
  • 数据区(Data Blocks):以4KB为单位,存放文件内容。

在inode table中保存了文件对应的所有属性,那么一个inode如何与属于自己的文件内容关联起来呢?

struct inode
{
	// 文件所有属性
	...
	blocks[15];
	...
}
//在inode的结构体中包含一个blocks的数组,这个数组保存了文件对应的block编号
//其中[0, 11]:直接保存该文件的blocks编号
//[12, 15]:指向一个datablock但是这个datablock不保存有效数据,而保存该文件所对应的其它块编号

还要注意的是,文件名也是文件属性,但是inode里面并不保存文件名;Linux下,底层实际都是通过inode编号来标识文件。那么操作系统是如何准确帮用户通过文件名找到对应的文件内容呢?首先,用户对文件进行操作时都是在一个目录下,不管是创建还是删除。其次目录也是一个文件,既然是文件就有属性和内容,其属性与普通文件类似,那么目录文件的内容是什么呢?

文件名并沒有被保存在文件内容中,操作系统又必须通过文件名帮用户查找文件内容,所以文件inode和文件名必须具有映射关系并且记录下来,在Linux系统中文件名和文件inode的映射关系被保存在目录的内容中。同时我们也注意到,Linux同一个目录下,不可以创建多个同名文件,这说明文件名本身是一个具有Key值的东西。

  • 创建一个新文件:当我们创建好一个新文件时,操作系统会找到自己所处的目录下,根据目录的inode编号查找到目录的datablock,然后将文件名和inode映射关系写入目录的数据块中。
  • 删除文件:操作系统删除一个文件并不会直接清除数据,而是将标记该文件对应的属性和数据块的相关位图清除(由1置0),所以删除的文件是可以恢复的。

1.3 软硬链接

  • 硬链接:通过索引节点(inode)来链接。
  • 软链接:通过名字引用另外一个文件。
  • 通过ls -l可以查看文件的硬链接数:
    [Linux] Linux文件系统
//创建一个软链接
ln -s 目标文件名 软链接名

//查看文件inode编号
ls -i

[Linux] Linux文件系统

上图可以看到软链接和目标文件使用的inode编号是不同的,软链接具有独立的inode编号;并且通过软链接mytest文件可以直接运行目标文件test,软链接相当于一个快捷方式,类似Windows系统,其中所保存的内容是指向文件所在路径。

//创建一个硬链接
ln 目标文件 硬链接名

[Linux] Linux文件系统
硬链接不是独立的文件,相当于一个指针,指向某一个inode,而硬链接数就是引用计数,有几个硬链接指向该inode编号硬链接数就是几。

Linux中我们常见目录如下
.  :当前目录
.. :上一级目录

这两个目录就是硬链接

[Linux] Linux文件系统

软硬链接的区别:软链接是一个独立的文件,有自己独立的inode编号;硬链接不是一个独立的文件,它和目标文件使用的是同一个inode。

1.4 动静态库

  • 静态库:程序在编译链接的时候把库的代码链接到可执行文件中,程序运行的时候将不再需要静态库;静态库Linux下后缀为.a文件,windows下后缀为.lib文件。
  • 动态库:程序在运行的时候才去链接动态库的代码,多个程序共享使用库的代码。动态库Linux下后缀为.so文件,windows下后缀为.dll文件。在Linux下,程序生成默认是动态连接。
  • 动态库可以在多个程序间共享,所以动态链接使得可执行文件更小,节省了磁盘空间。操作系统采用虚拟内存机制允许物理内存中的一份动态库被要用到该库的所有进程共用,节省了内存和磁盘空间
测试程序
 /add.h/
 #ifndef __ADD_H__
 #define __ADD_H__ 
 
 int add(int a, int b); 
 #endif // __ADD_H__
 /add.c/
 #include "add.h"
 
 int add(int a, int b)
 {
 	return a + b;
 }
 /sub.h/
 #ifndef __SUB_H__
 #define __SUB_H__ 
 
 int sub(int a, int b); 
 #endif // __SUB_H__
 /add.c/
 #include "add.h"
 
 int sub(int a, int b)
 {
 	return a - b;
 }
 ///main.c
 #include <stdio.h>
 #include "add.h"
 #include "sub.h"
 
 int main( void )
 {
 	int a = 10;
 	int b = 20;
 	printf("add(10, 20)=%d\n", a, b, add(a, b));
 	a = 100;
 	b = 20;
 	printf("sub(%d,%d)=%d\n", a, b, sub(a, b));
 }

//生成静态库
ar -rc libmymath.a add.o sub.o 
ar是gnu归档工具,rc表示(replace and create)

//查看静态库中的目录列表
ar -tv libmymath.a   
t:列出静态库中的文件

//gcc编译链接第三方库
gcc main.c -L. -lmymath
-L 指定库路径
-l 指定库名

[Linux] Linux文件系统

将生成的静态库删除后,程序依旧可以正常运行,如下图:
[Linux] Linux文件系统

//生成动态库
//shared: 表示生成共享库格式
//fPIC:产生位置无关码(position independent code)
//库名规则:libxxx.so
gcc -fPIC -c sub.c add.c
gcc -shared -o libmymath.so add.o sub.o

[Linux] Linux文件系统
同样是上面的add.c和sub.c文件形成.o文件再生成一个动态库,将动态库使用gcc编译main.c文件形成可执行文件,在删除动态库之后,此时与静态库不同,该文件运行出错表示该动态库不存在。
那么链接静态库的时候为什么没有这个问题呢?或者说链接动态库和静态库两者的区别是什么呢?

  • 静态链接,是将所需要的库文件中的代码拷贝进我们自己的代码中,然后再形成一个可执行程序,运行时程序中已经包含了库中的代码不需要依赖库。
  • 与静态链接不同,一个与动态库链接的可执行文件仅仅包含它用到的函数入口地址的一个表,而不是外部函数所在目标文件的整个机器码;在可执行文件开始运行以前,外部函数的机器码由操作系统从磁盘上的该动态库中复制到内存中,这个过程称为动态链接。

我们使用的库都是存放在磁盘上的文件,动态链接的可执行程序运行时会将动态链接库加载到内存中,加载到内存中的库代码只有一份,进程通过页表将进程地址空间和库链接起来,当使用动态链接库中的函数时会跳转到库中运行。
[Linux] Linux文件系统文章来源地址https://www.toymoban.com/news/detail-442790.html

到了这里,关于[Linux] Linux文件系统的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux系统-【文件传输】fsck命令 – 检查与修复文件系统

    fsck命令来自于英文词组“filesystem check”的缩写,其功能是用于检查与修复文件系统。若系统有过突然断电或磁盘异常的情况,建议使用fsck命令对文件系统进行检查与修复,以防数据丢失。 语法格式:  fsck [参数] 文件系统 测试环境:Centos7.6系统-服务器来自: 蓝易云 定位建

    2024年02月09日
    浏览(35)
  • Linux文件系列:磁盘,文件系统,软硬链接

    我们之前所学的都是被进程打开了的文件,接下来我们要学习没有被进程所打开的文件,它们是存储在磁盘当中的 要学习这些文件,首先我们要先学习一下磁盘 1.LBA地址 我们知道磁带在展开之后呈现一种带状结构,磁带中的数据就是以这种线性的方式进行存储的 那么我们可不可以

    2024年03月27日
    浏览(38)
  • linux的文件系统,理解一切皆文件

    open 函数具体使用哪个,和具体应用场景相关,如目标文件不存在,需要open创建,则第三个参数表示创建文件 的默认权限,否则,使用两个参数的open。 fopen fclose fread fwrite 都是C标准库当中的函数,我们称之为库函数(libc)。 open close read write lseek 都属于系统提供的接口,称之

    2024年02月10日
    浏览(30)
  • Linux系统编程:文件系统和inode

    目录 一. 磁盘的结构和读写数据的方式 1.1 磁盘级文件和内存级文件 1.2 磁盘的物理结构 1.3 访问磁盘数据的方式 二. 磁盘文件系统 2.1 磁盘的分区管理方法 2.2 文件名和inode的关系 三. 结合文件系统对文件创建和删除的相关问题的理解 3.1 文件创建时操作系统进行的工作

    2024年02月16日
    浏览(29)
  • Linux操作系统(六):文件系统组件

    参考资料:阿秀的笔记 Linux 「一切皆文件」 不仅 普通的文件和目录 ,就连 块设备、管道、socket 等,也都是统一交给文件系统管理的。 如何唯一标识文件? 索引节点 inode ,记录了文件的元信息,比如 inode 编号、文件大小、访问权限、创建时间、修改时间、数据在磁盘的位

    2024年04月11日
    浏览(29)
  • Linux 文件探秘:检查Linux系统的文件大小的四种神器

    博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接 : 🔗 精选专栏 : 《面试题大全》 — 面试准备的宝典! 《IDEA开发秘籍》 — 提升你的IDEA技能! 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师! 《100天精通Golang(基础入门篇)》 — 踏入

    2024年03月15日
    浏览(34)
  • 【Linux操作系统】探秘Linux奥秘:文件系统的管理与使用

    🌈个人主页: Sarapines Programmer 🔥 系列专栏: 《操作系统实验室》 🔖诗赋清音:柳垂轻絮拂人衣,心随风舞梦飞。 山川湖海皆可涉,勇者征途逐星辉。 目录 🪐1 初识Linux OS 🪐2 文件系统的管理与使用 🌍1. 实验目的 🌍2. 实验准备 🌍3. 实验内容 🌍4. 实验心得 📝总结

    2024年02月03日
    浏览(42)
  • 【Linux】文件周边001之系统文件IO

    👀 樊梓慕: 个人主页  🎥 个人专栏: 《C语言》 《数据结构》 《蓝桥杯试题》 《LeetCode刷题笔记》 《实训项目》 《C++》 《Linux》《算法》 🌝 每一个不曾起舞的日子,都是对生命的辜负 目录 前言 1.C语言文件IO 1.1C语言文件IO接口汇总  1.2当前路径指的是什么?  1.3stdi

    2024年01月24日
    浏览(38)
  • Linux系统:清除文件内容与两个特殊文件

    目录 一、理论 1.清除文件内容 2. /dev/null与 /dev/zero (1)使用echo命令 (2)使用truncate命令 该命令会将文件内容清空,并将文件大小设置为0。 (3)使用cat命令 该命令会将文件内容清空,但是文件大小不变。 (1)/dev/null Linux系统中,/dev/null被称为空设备,是一个特殊的设备

    2024年02月08日
    浏览(34)
  • Linux笔记:Linux中的文件系统权限

    在Red Hat Enterprise Linux 或其他类似的Linux发行版中,全局umask设置通常在几个不同的系统级配置文件中定义。以下是一些可能设置umask的地方: 这是为系统上的所有用户设置全局环境变量和启动程序的地方。通常,umask设置会在这个文件中定义。 对于使用Bash shell的系统,这个文

    2024年01月16日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包