C++中内存映射文件怎么用？大文件处理技术详解-C++-PHP中文网

C++中内存映射文件怎么用？大文件处理技术详解

P粉602998670

发布： 2025-06-26 10:29:01

原创

1115人浏览过

内存映射文件通过将文件直接映射到进程地址空间，使程序能像访问内存一样操作文件内容，从而显著提升大文件处理效率。其核心优势在于减少系统调用和数据拷贝。在linux/unix中使用mmap进行文件映射的步骤为：1. 使用open()打开文件；2. 调用mmap()将文件映射到内存；3. 操作完成后使用munmap()解除映射并close()关闭文件。windows下则通过createfile()、createfilemapping()和mapviewoffile()实现类似功能。内存映射文件的优势包括高效处理大文件、按需加载和简化文件操作。潜在陷阱有：文件大小变化可能导致崩溃，以及多进程写入时的数据竞争问题，需注意同步机制的设计。

C++中内存映射文件怎么用？大文件处理技术详解

内存映射文件，简单来说，就是把文件的一部分或者全部直接映射到进程的地址空间里。这样，你就可以像访问内存一样访问文件内容，省去了read/write这类系统调用的开销，尤其是在处理大文件时，效率提升非常明显。

内存映射文件在C++中主要通过 <sys/mman.h> (在Linux/Unix系统上) 或 Windows API 实现。核心思想是让操作系统帮你管理文件到内存的映射，你只需要操作内存地址即可。

文件映射能带来哪些好处？

立即学习“C++免费学习笔记（深入）”；

如何在Linux/Unix中使用mmap进行文件映射？

首先，你需要包含头文件 <sys/mman.h> 和 <fcntl.h>。然后，使用 open() 函数打开文件，接着使用 mmap() 函数将文件映射到内存。最后，使用 munmap() 解除映射，close() 关闭文件。

下面是一个简单的例子：

GPTKit

一个AI文本生成检测工具

108

查看详情

#include <iostream>
#include <fcntl.h>
#include <sys/mman.h>
#include <unistd.h>
#include <sys/stat.h>

int main() {
    const char* filepath = "example.txt";
    int fd = open(filepath, O_RDWR | O_CREAT, 0666); // 打开文件，可读写，如果不存在则创建
    if (fd == -1) {
        perror("open");
        return 1;
    }

    // 假设文件大小为100字节
    size_t filesize = 100;
    ftruncate(fd, filesize); // 调整文件大小

    // 将文件映射到内存
    void* map_ptr = mmap(nullptr, filesize, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
    if (map_ptr == MAP_FAILED) {
        perror("mmap");
        close(fd);
        return 1;
    }

    // 现在你可以像访问内存一样访问文件内容
    char* data = static_cast<char*>(map_ptr);
    for (size_t i = 0; i < filesize; ++i) {
        data[i] = 'A' + (i % 26); // 写入一些数据
    }

    // 确保将内存中的修改写回磁盘
    if (msync(map_ptr, filesize, MS_SYNC) == -1) {
        perror("msync");
    }

    // 解除映射
    if (munmap(map_ptr, filesize) == -1) {
        perror("munmap");
    }

    close(fd);
    return 0;
}

登录后复制

这个例子中，mmap() 函数将文件 "example.txt" 映射到进程的地址空间。PROT_READ | PROT_WRITE 指定了映射区域的权限，MAP_SHARED 指定了映射类型。msync() 函数用于将内存中的修改同步到磁盘。

Windows下如何使用CreateFileMapping和MapViewOfFile？

在Windows下，你需要使用 CreateFile(), CreateFileMapping(), 和 MapViewOfFile() 函数。

#include <iostream>
#include <windows.h>

int main() {
    const char* filepath = "example.txt";
    HANDLE hFile = CreateFile(
        filepath,
        GENERIC_READ | GENERIC_WRITE,
        0,
        NULL,
        CREATE_ALWAYS,
        FILE_ATTRIBUTE_NORMAL,
        NULL);

    if (hFile == INVALID_HANDLE_VALUE) {
        std::cerr << "CreateFile failed: " << GetLastError() << std::endl;
        return 1;
    }

    // 假设文件大小为100字节
    size_t filesize = 100;
    LARGE_INTEGER fileSize;
    fileSize.QuadPart = filesize;

    HANDLE hFileMapping = CreateFileMapping(
        hFile,
        NULL,
        PAGE_READWRITE,
        fileSize.HighPart,
        fileSize.LowPart,
        NULL);

    if (hFileMapping == NULL) {
        std::cerr << "CreateFileMapping failed: " << GetLastError() << std::endl;
        CloseHandle(hFile);
        return 1;
    }

    LPVOID map_ptr = MapViewOfFile(
        hFileMapping,
        FILE_MAP_ALL_ACCESS,
        0,
        0,
        filesize);

    if (map_ptr == NULL) {
        std::cerr << "MapViewOfFile failed: " << GetLastError() << std::endl;
        CloseHandle(hFileMapping);
        CloseHandle(hFile);
        return 1;
    }

    // 现在你可以像访问内存一样访问文件内容
    char* data = static_cast<char*>(map_ptr);
    for (size_t i = 0; i < filesize; ++i) {
        data[i] = 'A' + (i % 26); // 写入一些数据
    }

    // 确保将内存中的修改写回磁盘
    FlushViewOfFile(map_ptr, filesize);

    // 解除映射
    UnmapViewOfFile(map_ptr);
    CloseHandle(hFileMapping);
    CloseHandle(hFile);

    return 0;
}

登录后复制

这个例子中，CreateFile() 创建或打开文件，CreateFileMapping() 创建文件映射对象，MapViewOfFile() 将文件映射到进程的地址空间。FlushViewOfFile() 用于将内存中的修改同步到磁盘。