Linux下mmap-Toy模板网

这篇具有很好参考价值的文章主要介绍了Linux下mmap。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

目录

一.mmap简介

二.为什么需要使用mmap

三.mmap的使用

四.mmap原理

一.mmap简介

什么是mmap了？从名字上来看是memory map也就是地址映射，是一种内存映射文件的方法。mmap是一个可以将一个文件或者其它对象映射到进程的地址空间实现磁盘的地址和进程虚拟地址空间一段虚拟地址的一一对应关系。通过mmap这个系统调用我们可以让进程之间通过映射到同一个普通文件实现共享内存，普通文件被映射到进程地址空间当中之后，进程可以向访问普通内存一样对文件进行一系列操作。

二.为什么需要使用mmap

我们平时再读取文件的时候我们经常使用的方法就是read和write这两个操作系统给我们提供的方法来读写文件的时候，我们需要进行两次拷贝。由于read和write是系统调用所以我们需要先从用户态进入到内核态，然后将磁盘当中的数据拷贝到操作系统的缓冲区当中，然后再将缓冲区当中的数据拷贝到用户态当中。在这个过程当中我们进行了两次拷贝。其过程大致如下图所示：

但是如果我们使用mmap就可以减少一次拷贝这样带来性能上的提升是巨大的。并且我们采用内存操作比read和write要简单一些，我们不需要在用户层定义缓冲区用来保存从内核缓冲区读上来的数据，从而节约了内存的消耗。其大致流程如下：

总结：

日常当中使用read或者wirte时需要进行两次拷贝一次是从文件拷贝到内核缓冲区，一次是从内核缓冲区拷贝到用户态。当我们使用mmap时可以减少第二次拷贝，一旦内核将文件映射到内存之后用户进程就可以操作这些数据了，用户进程只需要修改内核当中的内容然后通过内核的内存管理器自动将这些数据刷新到磁盘当中。
mmap可以内存提高性能，内核空间和用户空间共用一个缓冲区，如果多个进程正在同一个文件当中进行IO操作那么他们通过使用mmap能够共享一个内核缓冲区从而到达减少内存的消耗

三.mmap的使用

1.首先我们来看看mmap这个函数的声明：

 #include <sys/mman.h>
 void *mmap(void *addr, size_t length, int prot, int flags, 
int fd, off_t offset);

函数说明：

创建虚拟内存到物理内存或者文件的映射，下面我们来看看他的这几个参数：

addr:映射区的起始地址，如果是NULL系统自动分配
length:字节长度自动按照4kb对齐所以建议大小一般填成4kb的整数倍
port：映射区域的权限
flags:映射的标志位
fd:文件描述符
offset:文件偏移量自动按照4k对齐

下面我们来说明一下port的取值：

PORT_EXEC:映射的区域具有可执行权限

PROT_READ:映射的区域具有可读权限

PROT_WRITE:映射区域具有可写权限

PROT_NONE:映射区域不可被访问

对应flags的取值：

MAP_SHARED：对映射区域的写入操作直接反映到文件当中

MAP_FIXED:若在start上无法创建映射则失败（如果没有此标记会自动创建）

MAP_PRIVATE:对映射区域的写入操作只反映到缓冲区当中不会写入到真正的文件

MAP_ANONYMOUS:匿名映射将虚拟地址映射到物理内存而不是文件（忽略fd)

MAP_DENYWRITE:拒绝其它文件的写入操作

MAP_LOCKED:锁定映射区域保证其不被置换

返回值：函数的返回值为最后文件映射到进程空间的地址，进程可直接操作起始地址为该值的有效地址。

下面我们来演示一下映射到物理内存的案例：

#include <iostream>
#include <sys/mman.h>
#include <cstring>
#include <cerrno>
#include <cstdio>
using namespace std;
static const int SIZE = 4096;
int main()
{
    char *str = (char *)mmap(NULL, SIZE, PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, 0, 0);
    //注意MAP_PRIVATE和MAP_SHARED
    //建立映射
    if (str == MAP_FAILED)
    {
        printf("%s\n", strerror(errno));
        return -2;
    }
    strcpy(str, "hello ksy");
    puts(str);
    //用于取消映射
    munmap(str, SIZE);

    return 0;
}

运行结果：

下面我们来看一下这个映射到文件该如何进行操作了，这个是特别容易错的。

下面直接给代码（注意这个代码是错误的）

#include <iostream>
#include <sys/mman.h>
#include <cstring>
#include <cerrno>
#include <cstdio>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>
using namespace std;
static const int SIZE = 4096;
int main()
{
    int fd=open("./a.txt",O_RDWR|O_CREAT,0644);
    if(fd<0){
        printf("%s\n",strerror(errno));
        return -1;
    }
    char *str = (char *)mmap(NULL, SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
    //注意MAP_PRIVATE和MAP_SHARED
    //建立映射
    if (str == MAP_FAILED)
    {
        printf("%s\n", strerror(errno));
        close(fd);
        return -2;
    }
    strcpy(str,"helloworld");
    close(fd);
   

    return 0;
}

然后我们编译一下然后再看一下结果：

很多老铁可能直接就懵逼了，没问题啊文件也有啊映射也成功了啊为什么就是映射出现错误了。下面我们来分析一下：

mmap是将虚拟内存映射到文件（物理内存）。按照我们的想法"helloworld"这个字符串应该是要被写入到文件当中。但是我们想一下我们这个文件是新创建的，好像大小是0个字节耶，那么在映射的时候好像也是映射了0个字节，所以这个文件映射过来的内存是没有的，此时我们让里面写东西崩溃了也是正常的。此时我们可以使用truncate函数对文件提前进行处理一下

下面我们来看一下truncate这个函数的原型：

 int truncate(const char *path, off_t length);

函数说明：truncate()会将参数path指定的文件大小改为参数length指定的大小。如果原来的文件大小比参数length大，则超过的部分会被删除。我们就可以提前使用这个函数提前将文件的大小进行设置这样我们就可以向映射的这块内存进行写入了。下面我们对代码进行一下修改

#include <iostream>
#include <sys/mman.h>
#include <cstring>
#include <cerrno>
#include <cstdio>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
using namespace std;
static const int SIZE = 4096;
int main()
{
    int fd = open("./a.txt", O_RDWR | O_CREAT, 0644);
    truncate("a.txt", 1024);
    if (fd < 0)
    {
        printf("%s\n", strerror(errno));
        return -1;
    }
    char *str = (char *)mmap(NULL, SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
    //注意MAP_PRIVATE和MAP_SHARED
    //建立映射
    if (str == MAP_FAILED)
    {
        printf("%s\n", strerror(errno));
        close(fd);
        return -2;
    }
    strcpy(str, "helloworld");
    close(fd);

    return 0;
}

然后我们在运行一下代码：