mmap 函数是 unix/linux 下的系统调用.
当存在客户 - 服务程序中复制文件时候, 其数据流如下, 要经历四次数据复制, 开销很大.
如果采用共享内存的方式, 那么将大大优化 IO 操作, 数据流变成了如下, 数据只复制两次:
映射文件或设备到内存中, 取消映射就是 munmap 函数.
语法如下:
- void
- *mmap(void*addr,size_tlength,intprot,intflags,
- intfd,off_toffset);
- int
- munmap(void*addr,size_tlength);
该函数主要用途有三个:
l  将普通文件映射到内存中, 通常在需要对文件进行频繁读写时使用, 用内存读写取代 I/O 读写, 以获得较高的性能;
l  将特殊文件进行匿名内存映射, 为关联进程提供共享内存空间;
l  为无关联的进程间的 Posix 共享内存 (SystemV 的共享内存操作是 shmget/shmat)
我们来看下函数的入参选择:
ÃÂ 参数 addr:
指向欲映射的内存起始地址, 通常设为 NULL, 代表让系统自动选定地址, 映射成功后返回该地址.
ÃÂ 参数 length:
代表将文件中多大的部分映射到内存.
ÃÂ 参数 prot:
映射区域的保护方式. 可以为以下几种方式的组合:
PROT_EXEC 映射区域可被执行
PROT_READ 映射区域可被读取
PROT_WRITE 映射区域可被写入
PROT_NONE 映射区域不能存取
ÃÂ 参数 flags:
影响映射区域的各种特性. 在调用 mmap() 时必须要指定 MAP_SHARED 或 MAP_PRIVATE.
MAP_FIXED 如果参数 start 所指的地址无法成功建立映射时, 则放弃映射, 不对地址做修正. 通常不鼓励用此.
MAP_SHARED 对映射区域的写入数据会复制回文件内, 而且允许其他映射该文件的进程共享.
MAP_PRIVATE 对映射区域的写入操作会产生一个映射文件的复制, 即私人的 "写入时复制"(copy on write) 对此区域作的任何修改都不会写回原来的文件内容.
MAP_ANONYMOUS 建立匿名映射. 此时会忽略参数 fd, 不涉及文件, 而且映射区域无法和其他进程共享.
MAP_DENYWRITE 只允许对映射区域的写入操作, 其他对文件直接写入的操作将会被拒绝.
MAP_LOCKED 将映射区域锁定住, 这表示该区域不会被置换 (swap).
ÃÂ 参数 fd:
要映射到内存中的文件描述符. 如果使用匿名内存映射时, 即 flags 中设置了 MAP_ANONYMOUS,fd 设为 - 1.
ÃÂ 参数 offset:
文件映射的偏移量, 通常设置为 0, 代表从文件最前方开始对应, offset 必须是分页大小的整数倍. 如下图内存映射文件的示例.
1.1.1.1 共享映射
修改共享内存中的文件内容:
- #include <sys/mman.h>
- #include <sys/stat.h>
- #include <fcntl.h>
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- #include <error.h>
- int
- main (int argc, char **argv)
- {
- int fd, nread, i;
- struct stat sb;
- char *mapped;
- if ( argc <= 1 )
- {
- printf("%s: Need file path! \n",argv[0]);
- exit(-1);
- }
- /* 打开文件 */
- if ((fd = open (argv[1], O_RDWR)) <0)
- {
- perror ("open");
- }
- /* 获取文件的属性 */
- if ((fstat (fd, &sb)) == -1)
- {
- perror ("fstat");
- }
- /* 将文件映射至进程的地址空间 */
- if ((mapped = (char *) mmap (NULL, sb.st_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0)) == (void *) -1)
- {
- perror ("mmap");
- }
- /* 映射完后, 关闭文件也可以操纵内存 */
- close (fd);
- printf ("%s", mapped);
- /* 修改一个字符, 同步到磁盘文件 */
- mapped[0] = '0';
- if ((msync ((void *) mapped, sb.st_size, MS_SYNC)) == -1)
- {
- perror ("msync");
- }
- /* 释放存储映射区 */
- if ((munmap ((void *) mapped, sb.st_size)) == -1)
- {
- perror ("munmap");
- }
- return 0;
- }
编译后, 即可执行, 参数为当前目录的一个文件名字.
例如在当前目录下创建一个 hello.txt, 存入 hello 单词, 然后执行./a.out hello.txt, 完毕后发现文件中的第一个字母 h 变成了0. 程序将文件映射到了内存中, 并将第一个字符进行了修改并同步到了磁盘文件 hello.txt 中.
1.1.1.2 父子进程通信
使用 fork 创建进程, 父子进程分别往共享内存中写入各自字符串, 并读出.
- #include <sys/mman.h>
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- #define BUF_SIZE 100
- int
- main (int argc, char **argv)
- {
- char *p_map;
- /* 匿名映射, 创建一块内存供父子进程通信 */
- p_map = (char *) mmap (NULL, BUF_SIZE, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0);
- if (fork () == 0)
- {
- sleep (1);
- printf ("child got a message: %s\n", p_map);
- sprintf (p_map, "%s", "from u son");
- munmap (p_map, BUF_SIZE); // 实际上, 进程终止时, 会自动解除映射.
- exit (0);
- }
- sprintf (p_map, "%s", "from u father");
- sleep (2);
- printf ("parent got a message: %s\n", p_map);
- return 0;
- }
1.1.1.3 内存访问溢出
linux 采用的是页式管理机制, 使用 mmap() 映射普通文件后, 进程会在自己的地址空间新增一块空间, 空间大小由 mmap() 的 len 参数指定. 但是, 进程并不一定能够对全部新增空间都能进行有效访问. 进程能够访问的有效地址大小取决于文件被映射部分的大小. 决定进程能访问的大小是容纳文件被映射部分的最小页面数. 如下图.
- #include <sys/mman.h>
- #include <sys/types.h>
- #include <sys/stat.h>
- #include <fcntl.h>
- #include <unistd.h>
- #include <stdio.h>
- int
- main (int argc, char **argv)
- {
- int fd, i;
- int pagesize, offset;
- char *p_map;
- struct stat sb;
- /* 取得 page size */
- pagesize = sysconf (_SC_PAGESIZE);
- printf ("pagesize is %d\n", pagesize);
- /* 打开文件 */
- fd = open (argv[1], O_RDWR, 00777);
- fstat (fd, &sb);
- printf ("file size is %zd\n", (size_t) sb.st_size);
- offset = 0;
- p_map = (char *) mmap (NULL, pagesize * 2, PROT_READ | PROT_WRITE,
- MAP_SHARED, fd, offset);
- close (fd);
- // p_map[sb.st_size] = '9'; /* 导致总线错误 */
- p_map[pagesize+1] = '9'; /* 导致段错误 */
- munmap (p_map, pagesize * 2);
- return 0;
- }
参考:
UNIX 网络编程卷2
来源: https://yq.aliyun.com/articles/583688