进程 / 线程模型
一、进程的基本概念
1.1 多道程序设计
基本思想是允许多个程序同时进入内存并运行,提高 CPU 的利用率,其目的是为了提高系统效率。
说明:在第一幅图中在内存中有四个程序,这四个程序是串行执行的,因为这里只有一个程序计数器。当有了多道程序技术之后就得到了第二幅图中所示的场景,每个程序各自独立的占用一个逻辑程序计数器,这样就达到了一种并发执行的效果,我们从第三幅图中可以看到多个程序是轮流执行的。
1.2 并发环境与并发程序
并发环境就是指一段时间间隔内,单处理器上有两个或两个以上的程序同时处于开始运行但尚未结束的状态,并且次序不是事先确定的。而在并发环境下执行的程序就是并发程序。
1.3 进程的定义
定义:进程是具有独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配和调度的独立单位。
- 进程是程序的一次执行过程,一个程序执行多次那是不同的进程
- 是正在运行的程序的抽象,或者说是对 CPU 的一个抽象。
- 将一个 CPU 变换成多个虚拟的 CPU
- 系统资源以进程为单位分配,如内存、文件等,操作系统为每个独立的进程分配了独立的地址空间。
- 操作系统将 CPU 调度给需要的进程,即将 CPU 的控制权交给某个进程就称为调度。
1.4 进程控制块 PCB
- 进程控制块又称进程描述符或进程属性
- 操作用于管理控制进程的一个专门的数据结构
- 记录进程的各种属性,描述进程的动态变化过程
-
PCB 是系统感知进程存在的唯一标志:进程与 PCB 是一一对应的
- 进程表:所有进程的 PCB 集合。进程表的大小往往是固定的,这也就决定了一个操作系统最多支持多少个进程,有时我们称为系统支持的并发度。
1.4.1 PCB 中需要保存的信息
-
1、进程描述信息
- 进程标识符(process id),这个标识是唯一的,通常是一个整数
- 进程名,通常基于可执行文件名,这是不唯一的
- 用户标识符(user id)
- 进程组关系
-
2、进程控制信息
- 当前状态
- 优先级
- 代码执行入口地址
- 程序的磁盘地址
- 运行统计信息(执行时间、页面调度)
- 进程间同步和通信
- 进程的队列指针
- 进程的消息队列指针
-
3、所拥有的资源和使用情况
-
4、CPU 线程信息
这是当 CPU 不运行的时候操作系统需要把一些重要的信息记录下来
- 寄存器值(通用寄存器、程序计数器 PC、程序状态字 PSW、栈指针)
- 指向该进程页表的指针
1.4.2 换个角度看 PCB 的内容
说明:从上图中可以看到第一列是和进程管理相关的字段,第二列是存储管理的字段,第三列是文件管理的字段。
二、进程状态及状态转换
2.1 进程的三种基本状态
即运行态、就绪态、等待态。
- 运行态:占用 CPU,并在 CPU 上运行
- 就绪态:已经具备运行条件,但由于没有空闲 CPU,而暂时不能运行
-
等待态:因等待某一事件而暂时不能运行,如等待读盘结果。又称为阻塞态、封锁态、睡眠态。其转换过程如下:
2.2 进程的其他状态
-
创建态
- 已完成创建一个进程所必要的工作,如 PID、PCB
- 但尚未同意执行该进程,因为资源有限
-
终止态
- 终止执行后,进程进入该状态
- 可完成一些数据统计工作
- 资源回收
-
挂起态
- 用于调节负载
- 进程不占用内存空间,其进程映像交换到磁盘上
2.3 五状态模型
2.4 七状态模型
2.5 Linux 状态转换示意图
说明:这里使用 fork() 创建一个进程。浅度睡眠和深度睡眠不同在于前者在睡眠时会接收信号,而后者则不会。正在运行的程序可能因为调试断点可能出现一个暂停的状态。
三、进程队列
- 操作系统为每一类进程建立一个或多个队列
- 队列元素为 PCB
- 伴随进程状态的改变,其 PCB 从一个队列进入另一个队列
说明:真实情况下,就绪态也是排多个队列。而等待态由于各自产生的原因(事件)不同而排不同的队列。
3.1 五状态进程模型的队列模型
四、进程控制
进程控制操作完成进程各状态之间的转换,由具有特定功能的原语(其实就是程序,只是这些程序不许与被中断)完成。关于进程控制的原语如下:
- 进程创建原语
- 进程撤销原语
- 阻塞原语
- 唤醒原语
- 激活原语
- 改变进程优先级
原语:完成某种特定功能的一段程序,具有不可分割性或不可中断性,即原语的执行必须是连续的,在执行过程中不允许被中断。又称原子操作。
4.1 进程的创建
- 给新进程分配一个唯一标识以及进程控制块(没有被使用的)
- 为进程分配独立地址空间
- 初始化进程控制块:设置默认值(如状态为 New...)
- 设置相应地队列指针。如:把新进程加到就绪队列链表中
- 主要操作是 UNIX 中:fork/exec,Windows 中:CreateProcess
4.2 进程的撤销
也就是结束进程,主要完成的工作:
- 回收进程所占用的资源,如关闭打开的文件、断开网络连接、回收分配的内存等
- 撤销该进程的 PCB
- 在 UNIX 中使用:exit,Windows 中:TerminateProcess
4.3 进程阻塞
处于运行状态的进程,在其运行过程中期待某一事件发生,如等待键盘输入、等待磁盘数据传输完成、等待其他进程发送消息。当被等待的事件未发生时,由进程自己执行阻塞原语,使自己由运行态变为阻塞态。在 UNIX 中我们使用 wait,在 Windows 中使用 WaitForSingleObject。
4.4 UNIX 的几个进程控制操作
-
fork() 通过复制调用进程来建立新的进程,是最基本的进程建立过程。也就是通过复制父进程来创建子进程。
-
exec() 包括一些列系统调用,它们都是通过用一段新的程序代码覆盖原来的地址空间,实现进程代码的转换
-
wait() 提供初级进程同步操作,能使一个进程等待另一个进程的结束
-
exit() 用来终止一个进程的运行
UNIX 中 fork() 实现:
- 为子进程分配一个空闲的进程描述符,即 PCB,在 UNIX 中又叫 proc 结构
- 分配给子进程唯一标识 pid
- 以一次一页的方式复制父进程的地址空间,这是一个无用功,因为创建子进程就是为了让子进程完成与父进程不同的工作,所以父进程的很多内容其实子进程是不需要的。于是在 Linux 中采用了写复制技术 COW 加快创建进程。
- 从父进程处共享资源,如打开的文件和当前工作目录等
- 将子进程的状态设置为就绪,插入到就绪队列
- 对子进程返回标识符 0
- 向父进程返回子进程的 pid
来源: http://www.jianshu.com/p/b3fec37ee616