可执行文件 页面 window contex round save () 唤醒
尽管内核模块不象应用程序一样顺序执行, 内核做的大部分动作是代表一个特定进程的. 内核代码可以引用当前进程, 通过存取全局项 current, 它在 中定义, 它产生一个指针指向结构 task_struct, 在 <Linux/sched.h> 定义. current 指针指向当前在运行的进程. 在一个系统调用执行期间, 例如 open 或者 read, 当前进程是发出调用的进程. 内核代码可以通过使用 current 来使用进程特定的信息, 如果它需要这样.
实际上, current 不真正地是一个全局变量. 支持 SMP 系统的需要强迫内核开发者去开发一种机制, 在相关的 CPU 上来找到当前进程. 这种机制也必须快速, 因为对 current 的引用非常频繁地发生. 结果就是一个依赖体系的机制, 常常, 隐藏了一个指向 task_struct 的指针在内核堆栈内. 实现的细节对别的内核子系统保持隐藏, 一个设备驱动可以只包含 <linux/sched.h> 并且引用当前进程. 例如, 下面的语句打印了当前进程的进程 ID 和命令名称, 通过存取结构 task_struct 中的某些字段.
task_struct 在 linux 的定义如下:
- 1 struct task_struct {
- 2 volatile long state;
- /* -1 unrunnable, 0 runnable, >0 stopped */
- 3 struct thread_info * thread_info;
- 4 atomic_t usage;
- 5 unsigned long flags;
- /* per process flags, defined below */
- 6 unsigned long ptrace;
- 7 8 int lock_depth;
- /* Lock depth */
- 9 10 int prio,
- static_prio;
- 11 struct list_head run_list;
- 12 prio_array_t * array;
- 13 14 unsigned long sleep_avg;
- 15 long interactive_credit;
- 16 unsigned long long timestamp;
- 17 int activated;
- 18 19 unsigned long policy;
- 20 cpumask_t cpus_allowed;
- 21 unsigned int time_slice,
- first_time_slice;
- 22 23 struct list_head tasks;
- 24
- /*
- 25 * ptrace_list/ptrace_children forms the list of my children
- 26 * that were stolen by a ptracer.
- 27 */
- 28 struct list_head ptrace_children;
- 29 struct list_head ptrace_list;
- 30 31 struct mm_struct * mm,
- *active_mm;
- 32 33
- /* task state */
- 34 struct linux_binfmt * binfmt;
- 35 int exit_code,
- exit_signal;
- 36 int pdeath_signal;
- /* The signal sent when the parent dies */
- 37
- /* ??? */
- 38 unsigned long personality;
- 39 int did_exec: 1;
- 40 pid_t pid;
- 41 pid_t tgid;
- 42
- /*
- 43 * pointers to (original) parent process, youngest child, younger sibling,
- 44 * older sibling, respectively. (p->father can be replaced with
- 45 * p->parent->pid)
- 46 */
- 47 struct task_struct * real_parent;
- /* real parent process (when being debugged) */
- 48 struct task_struct * parent;
- /* parent process */
- 49
- /*
- 50 * children/sibling forms the list of my children plus the
- 51 * tasks I'm ptracing.
- 52 */
- 53 struct list_head children;
- /* list of my children */
- 54 struct list_head sibling;
- /* linkage in my parent's children list */
- 55 struct task_struct * group_leader;
- /* threadgroup leader */
- 56 57
- /* PID/PID hash table linkage. */
- 58 struct pid_link pids[PIDTYPE_MAX];
- 59 60 wait_queue_head_t wait_chldexit;
- /* for wait4() */
- 61 struct completion * vfork_done;
- /* for vfork() */
- 62 int __user * set_child_tid;
- /* CLONE_CHILD_SETTID */
- 63 int __user * clear_child_tid;
- /* CLONE_CHILD_CLEARTID */
- 64 65 unsigned long rt_priority;
- 66 unsigned long it_real_value,
- it_prof_value,
- it_virt_value;
- 67 unsigned long it_real_incr,
- it_prof_incr,
- it_virt_incr;
- 68 struct timer_list real_timer;
- 69 unsigned long utime,
- stime,
- cutime,
- cstime;
- 70 unsigned long nvcsw,
- nivcsw,
- cnvcsw,
- cnivcsw;
- /* context switch counts */
- 71 u64 start_time;
- 72
- /* mm fault and swap info: this can arguably be seen as either mm-specific or thread-specific */
- 73 unsigned long min_flt,
- maj_flt,
- cmin_flt,
- cmaj_flt;
- 74
- /* process credentials */
- 75 uid_t uid,
- euid,
- suid,
- fsuid;
- 76 gid_t gid,
- egid,
- sgid,
- fsgid;
- 77 struct group_info * group_info;
- 78 kernel_cap_t cap_effective,
- cap_inheritable,
- cap_permitted;
- 79 int keep_capabilities: 1;
- 80 struct user_struct * user;
- 81
- /* limits */
- 82 struct rlimit rlim[RLIM_NLIMITS];
- 83 unsigned short used_math;
- 84 char comm[16];
- 85
- /* file system info */
- 86 int link_count,
- total_link_count;
- 87
- /* ipc stuff */
- 88 struct sysv_sem sysvsem;
- 89
- /* CPU-specific state of this task */
- 90 struct thread_struct thread;
- 91
- /* filesystem information */
- 92 struct fs_struct * fs;
- 93
- /* open file information */
- 94 struct files_struct * files;
- 95
- /* namespace */
- 96 struct namespace * namespace;
- 97
- /* signal handlers */
- 98 struct signal_struct * signal;
- 99 struct sighand_struct * sighand;
- 100 101 sigset_t blocked,
- real_blocked;
- 102 struct sigpending pending;
- 103 104 unsigned long sas_ss_sp;
- 105 size_t sas_ss_size;
- 106 int( * notifier)(void * priv);
- 107 void * notifier_data;
- 108 sigset_t * notifier_mask;
- 109 110 void * security;
- 111 struct audit_context * audit_context;
- 112 113
- /* Thread group tracking */
- 114 u32 parent_exec_id;
- 115 u32 self_exec_id;
- 116
- /* Protection of (de-)allocation: mm, files, fs, tty */
- 117 spinlock_t alloc_lock;
- 118
- /* Protection of proc_dentry: nesting proc_lock, dcache_lock, write_lock_irq(&tasklist_lock); */
- 119 spinlock_t proc_lock;
- 120
- /* context-switch lock */
- 121 spinlock_t switch_lock;
- 122 123
- /* journalling filesystem info */
- 124 void * journal_info;
- 125 126
- /* VM state */
- 127 struct reclaim_state * reclaim_state;
- 128 129 struct dentry * proc_dentry;
- 130 struct backing_dev_info * backing_dev_info;
- 131 132 struct io_context * io_context;
- 133 134 unsigned long ptrace_message;
- 135 siginfo_t * last_siginfo;
- /* For ptrace use. */
- 136 137#ifdef CONFIG_NUMA 138 struct mempolicy * mempolicy;
- 139 short il_next;
- /* could be shared with used_math */
- 140#endif 141
- };
1. 调度数据成员 (1) volatile long states; 表示进程的当前状态:? TASK_RUNNING: 正在运行或在就绪队列 run-queue 中准备运行的进程,实际参与进程调度。? TASK_INTERRUPTIBLE: 处于等待队列中的进程,待资源有效时唤醒,也可由其它进程通过信号(signal) 或定时中断唤醒后进入就绪队列 run-queue。? TASK_UNINTERRUPTIBLE: 处于等待队列中的进程,待资源有效时唤醒,不可由其它进程通过信号 (signal) 或定时中断唤醒。? TASK_ZOMBIE: 表示进程结束但尚未消亡的一种状态 (僵死状态)。此时,进程已经结束运行且释放大部分资源,但尚未释放进程控制块。?TASK_STOPPED: 进程被暂停,通过其它进程的信号才能唤醒。导致这种状态的原因有二,或者是对收到 SIGSTOP、SIGSTP、SIGTTIN 或 SIGTTOU 信号的反应,或者是受其它进程的 ptrace 系统调用的控制而暂时将 CPU 交给控制进程。? TASK_SWAPPING: 进程页面被交换出内存的进程。(2) unsigned long flags; 进程标志:?PF_ALIGNWARN 打印 "对齐" 警告信息。?PF_PTRACED 被 ptrace 系统调用监控。?PF_TRACESYS 正在跟踪。?PF_FORKNOEXEC 进程刚创建,但还没执行。?PF_SUPERPRIV 超级用户特权。?PF_DUMPCORE dumped core。?PF_SIGNALED 进程被信号(signal) 杀出。?PF_STARTING 进程正被创建。?PF_EXITING 进程开始关闭。?PF_USEDFPU 该进程使用 FPU(SMP only)。?PF_DTRACE delayed trace (used on m68k)。(3) long priority; 进程优先级。 Priority 的值给出进程每次获取 CPU 后可使用的时间 (按 jiffies 计)。优先级可通过系统调用 sys_setpriorty 改变(在 kernel/sys.c 中)。(4) unsigned long rt_priority;rt_priority 给出实时进程的优先级,rt_priority+1000 给出进程每次获取 CPU 后可使用的时间(同样按 jiffies 计)。实时进程的优先级可通过系统 调用 sys_sched_setscheduler() 改变 (见 kernel/sched.c)。(5) long counter; 在 轮转法调度时表示进程当前还可运行多久。在进程开始运行是被赋为 priority 的值,以后每隔一个 tick(时钟中断) 递减 1,减到 0 时引起新一轮调 度。重新调度将从 run_queue 队列选出 counter 值最大的就绪进程并给予 CPU 使用权,因此 counter 起到了进程的动态优先级的作用 (priority 则是静态优先级)。(6) unsigned long policy; 该进程的进程调度策略,可以通过系统调用 sys_sched_setscheduler()更改 (见 kernel/sched.c)。调度策略有:?SCHED_OTHER 0 非实时进程,基于优先权的轮转法(round robin)。?SCHED_FIFO 1 实时进程,用先进先出算法。?SCHED_RR 2 实时进程,用基于优先权的轮转法。2. 信号处理(1) unsigned long signal; 进程接收到的信号。每位表示一种信号,共 32 种。置位有效。(2) unsigned long blocked; 进程所能接受信号的位掩码。置位表示屏蔽,复位表示不屏蔽。(3) struct signal_struct *sig; 因 为 signal 和 blocked 都是 32 位的变量,Linux 最多只能接受 32 种信号。对每种信号,各进程可以由 PCB 的 sig 属性选择使用自定义的处理 函数,或是系统的缺省处理函数。指派各种信息处理函数的结构定义在 include/linux/sched.h 中。对信号的检查安排在系统调用结束后,以 及 "慢速型" 中断服务程序结束后(IRQ#_interrupt(),参见 9。5 节 "启动内核")。3. 进程队列指针(1) struct task_struct *next_task,*prev_task; 所有进程(以 PCB 的形式) 组成一个双向链表。next_task 和就是链表的前后指针。链表的头和尾都是 init_task(即 0 号进程)。(2) struct task_struct *next_run,*prev_run; 由正在运行或是可以运行的,其进程状态均为 TASK_RUNNING 的进程所组成的一个双向循环链表,即 run_queue 就绪队列。该链表的前后向指针用 next_run 和 prev_run,链表的头和尾都是 init_task(即 0 号进程)。(3) struct task_struct *p_opptr,*p_pptr; 和 struct task_struct *p_cptr,*p_ysptr,*p_osptr; 以上分别是指向原始父进程 (original parent)、父进程(parent)、子进程(youngest child) 及新老兄弟进程 (younger sibling,older sibling) 的指针。4. 进程标识 (1) unsigned short uid,gid;uid 和 gid 是运行进程的用户标识和用户组标识。(2) int groups[NGROUPS]; 与多数现代 UNIX 操作系统一样,Linux 允许进程同时拥有一组用户组号。在进程访问文件时,这些组号可用于合法性检查。(3) unsigned short euid,egid;euid 和 egid 又称为有效的 uid 和 gid。出于系统安全的权限的考虑,运行程序时要检查 euid 和 egid 的合法性。通常,uid 等于 euid,gid 等于 egid。有时候,系统会赋予一般用户暂时拥有 root 的 uid 和 gid(作为用户进程的 euid 和 egid),以便于进行运作。(4) unsigned short fsuid,fsgid;fsuid 和 fsgid 称为文件系统的 uid 和 gid,用于文件系统操作时的合法性检查,是 Linux 独特的标识类型。它们一般分别和 euid 和 egid 一致,但在 NFS 文件系统中 NFS 服务器需要作为一个特殊的进程访问文件,这时只修改客户进程的 fsuid 和 fsgid。(5) unsigned short suid,sgid;suid 和 sgid 是根据 POSIX 标准引入的,在系统调用改变 uid 和 gid 时,用于保留真正的 uid 和 gid。(6) int pid,pgrp,session; 进程标识号、进程的组织号及 session 标识号,相关系统调用(见程序 kernel/sys.c) 有 sys_setpgid、sys_getpgid、sys_setpgrp、sys_getpgrp、sys_getsid 及 sys_setsid 几种。(7) int leader; 是否是 session 的主管,布尔量。5. 时间数据成员 (1) unsigned long timeout; 用于软件定时,指出进程间隔多久被重新唤醒。采用 tick 为单位。(2) unsigned long it_real_value,it_real_iner; 用 于 itimer(interval timer) 软件定时。采用 jiffies 为单位,每个 tick 使 it_real_value 减到 0 时向进程发信号 SIGALRM,并重新置初值。初值由 it_real_incr 保存。具体代码见 kernel/itimer.c 中的函数 it_real_fn()。(3) struct timer_list real_timer; 一种定时器结构 (Linux 共有两种定时器结构,另一种称作 old_timer)。数据结构的定义在 include/linux/timer.h 中,相关操作函数见 kernel/sched.c 中 add_timer() 和 del_timer()等。(4) unsigned long it_virt_value,it_virt_incr; 关 于进程用户态执行时间的 itimer 软件定时。采用 jiffies 为单位。进程在用户态运行时,每个 tick 使 it_virt_value 减 1,减到 0 时 向进程发信号 SIGVTALRM,并重新置初值。初值由 it_virt_incr 保存。具体代码见 kernel/sched.c 中的函数 do_it_virt()。(5) unsigned long it_prof_value,it_prof_incr; 同样是 itimer 软件定时。采用 jiffies 为单位。不管进程在用户态或内核态运行,每个 tick 使 it_prof_value 减 1,减到 0 时向进程发信号 SIGPROF,并重新置初值。初值由 it_prof_incr 保存。 具体代码见 kernel/sched.c 中的函数 do_it_prof。(6) long utime,stime,cutime,cstime,start_time; 以上分别为进程在用户态的运行时间、进程在内核态的运行时间、所有层次子进程在用户态的运行时间总和、所有层次子进程在核心态的运行时间总和,以及创建该进程的时间。6. 信号量数据成员 (1) struct sem_undo *semundo; 进 程每操作一次信号量,都生成一个对此次操作的 undo 操作,它由 sem_undo 结构描述。这些属于同一进程的 undo 操作组成的链表就由 semundo 属性指示。当进程异常终止时,系统会调用 undo 操作。sem_undo 的成员 semadj 指向一个数据数组,表示各次 undo 的量。结构定义在 include/linux/sem.h。(2) struct sem_queue *semsleeping; 每一信号量集合对应一 个 sem_queue 等待队列(见 include/linux/sem.h)。进程因操作该信号量集合而阻塞时,它被挂到 semsleeping 指示的关 于该信号量集合的 sem_queue 队列。反过来,semsleeping。sleeper 指向该进程的 PCB。7. 进程上下文环境(1) struct desc_struct *ldt; 进程关于 CPU 段式存储管理的局部描述符表的指针,用于仿真 WINE Windows 的程序。其他情况下取值 NULL,进程的 ldt 就是 arch/i386/traps.c 定义的 default_ldt。(2) struct thread_struct tss; 任务状态段,其内容与 INTEL CPU 的 TSS 对应,如各种通用寄存器. CPU 调度时,当前运行进程的 TSS 保存到 PCB 的 tss,新选中进程的 tss 内容复制到 CPU 的 TSS。结构定义在 include/linux/tasks.h 中。(3) unsigned long saved_kernel_stack; 为 MS-DOS 的仿真程序(或叫系统调用 vm86) 保存的堆栈指针。(4) unsigned long kernel_stack_page; 在内核态运行时,每个进程都有一个内核堆栈,其基地址就保存在 kernel_stack_page 中。8. 文件系统数据成员 (1) struct fs_struct *fs;fs 保存了进程本身与 VFS 的关系消息,其中 root 指向根目录结点,pwd 指向当前目录结点,umask 给出新建文件的访问模式(可由系统调用 umask 更 改),count 是 Linux 保留的属性,如下页图所示。结构定义在 include/linux/sched.h 中。(2) struct files_struct *files;files 包含了进程当前所打开的文件(struct file *fd[NR_OPEN])。在 Linux 中,一个进程最多只能同时打开 NR_OPEN 个文件。而且,前三项分别预先设置为标准输入、标准输出和出错消息输出文件。 (3) int link_count; 文件链(link) 的数目。9. 内存数据成员 (1) struct mm_struct *mm; 在 linux 中,采用按需分页的策略解决进程的内存需求。task_struct 的数据成员 mm 指向关于存储管理的 mm_struct 结构。其中包含了一个虚存队列 mmap,指向由若干 vm_area_struct 描述的虚存块。同时,为了加快访问速度,mm 中的 mmap_avl 维护了一个 AVL 树。在树中,所有的 vm_area_struct 虚存块均由左指针指向相邻的低虚存块,右指针指向相邻的高虚存块。 结构定义在 include/linux/sched.h 中。10. 页面管理(1) int swappable:1; 进程占用的内存页面是否可换出。swappable 为 1 表示可换出。对该标志的复位和置位均在 do_fork() 函数中执行 (见 kerenl/fork.c)。(2) unsigned long swap_address; 虚存地址比 swap_address 低的进程页面,以前已经换出或已换出过,进程下一次可换出的页面自 swap_address 开始。参见 swap_out_process() 和 swap_out_pmd()(见 mm/vmscan.c)。(3) unsigned long min_flt,maj_flt; 该 进程累计的 minor 缺页次数和 major 缺页次数。maj_flt 基本与 min_flt 相同,但计数的范围比后者广 (参见 fs/buffer.c 和 mm/page_alloc.c)。min_flt 只在 do_no_page()、do_wp_page() 里(见 mm/memory.c)计数新增的可 以写操作的页面。(4) unsigned long nswap; 该进程累计换出的页面数。(5) unsigned long cmin_flt,cmaj_flt,cnswap; 以本进程作为祖先的所有层次子进程的累计换入页面、换出页面计数。(6) unsigned long old_maj_flt,dec_flt;(7) unsigned long swap_cnt; 下一次信号最多可换出的页数。11. 支持对称多处理器方式 (SMP) 时的数据成员 (1) int processor; 进程正在使用的 CPU。(2) int last_processor; 进程最后一次使用的 CPU。(3) int lock_depth; 上下文切换时系统内核锁的深度。12. 其它数据成员(1) unsigned short used_math; 是否使用 FPU。(2) char comm[16]; 进程正在运行的可执行文件的文件名。(3) struct rlimit rlim[RLIM_NLIMITS]; 结 构 rlimit 用于资源管理,定义在 linux/include/linux/resource.h 中,成员共有两项: rlim_cur 是资源的当前最大 数目; rlim_max 是资源可有的最大数目。在 i386 环境中,受控资源共有 RLIM_NLIMITS 项,即 10 项,定义在 linux/include/asm/resource.h 中,见下表:(4) int errno; 最后一次出错的系统调用的错误号,0 表示无错误。系统调用返回时,全程量也拥有该错误号。(5) long debugreg[8]; 保存 INTEL CPU 调试寄存器的值,在 ptrace 系统调用中使用。(6) struct exec_domain *exec_domain;Linux 可以运行由 80386 平台其它 UNIX 操作系统生成的符合 iBCS2 标准的程序。关于此类程序与 Linux 程序差异的消息就由 exec_domain 结构保存。(7) unsigned long personality;Linux 可以运行由 80386 平台其它 UNIX 操作系统生成的符合 iBCS2 标准的程序。 Personality 进一步描述进程执行的程序属于何种 UNIX 平台的 "个性" 信息。通常有 PER_Linux、PER_Linux_32BIT、 PER_Linux_EM86、PER_SVR3、PER_SCOSVR3、PER_WYSEV386、PER_ISCR4、PER_BSD、 PER_XENIX 和 PER_MASK 等,参见 include/linux/personality.h。(8) struct linux_binfmt *binfmt; 指向进程所属的全局执行文件格式结构,共有 a。out、script、elf 和 Java 等四种。结构定义在 include/linux/binfmts.h 中(core_dump、load_shlib(fd)、load_binary、use_count)。(9) int exit_code,exit_signal; 引起进程退出的返回代码 exit_code,引起错误的信号名 exit_signal。(10) int dumpable:1; 布尔量,表示出错时是否可以进行 memory dump。(11) int did_exec:1; 按 POSIX 要求设计的布尔量,区分进程是正在执行老程序代码,还是在执行 execve 装入的新代码。(12) int tty_old_pgrp; 进程显示终端所在的组标识。(13) struct tty_struct *tty; 指向进程所在的显示终端的信息。如果进程不需要显示终端,如 0 号进程,则该指针为空。结构定义在 include/linux/tty.h 中。(14) struct wait_queue *wait_chldexit; 在进程结束时,或发出系统调用 wait4 后,为了等待子进程的结束,而将自己(父进程) 睡眠在该队列上。结构定义在 include/linux/wait.h 中。13. 进程队列的全局变量 (1) current; 当前正在运行的进程的指针,在 SMP 中则指向 CPU 组中正被调度的 CPU 的当前进程:#define current(0+current_set[smp_processor_id()])/*sched.h*/struct task_struct *current_set[NR_CPUS];(2) struct task_struct init_task; 即 0 号进程的 PCB,是进程的 "根",始终保持初值 INIT_TASK。(3) struct task_struct *task[NR_TASKS]; 进 程队列数组,规定系统可同时运行的最大进程数(见 kernel/sched.c)。NR_TASKS 定义在 include/linux/tasks.h 中,值为 512。每个进程占一个数组元素(元素的下标不一定就是进程的 pid),task[0] 必须指向 init_task(0 号进程)。可以通过 task[]数组遍历所有进程的 PCB。但 Linux 也提供一个宏定义 for_each_task()(见 include/linux/sched.h),它通过 next_task 遍历所有进程的 PCB:#define for_each_task(p) \for(p=&init_task;(p=p->next_task)!=&init_task;)(4) unsigned long volatile jiffies;Linux 的基准时间 (见 kernal/sched.c)。系统初始化时清 0,以后每隔 10ms 由时钟中断服务程序 do_timer() 增 1。(5) int need_resched; 重新调度标志位(见 kernal/sched.c)。当需要 Linux 调度时置位。在系统调用返回前(或者其它情形下),判断该标志是否置位。置位的话,马上调用 schedule 进行 CPU 调度。(6) unsigned long intr_count; 记 录中断服务程序的嵌套层数(见 kernal/softirq.c)。正常运行时,intr_count 为 0。当处理硬件中断、执行任务队列中的任务或者执 行 bottom half 队列中的任务时,intr_count 非 0。这时,内核禁止某些操作,例如不允许重新调度。
转自:http://blog.csdn.net/echoisland/article/details/6729061
linux 驱动 current, 引用当前进程,及 task_struct(转)
来源: http://www.bubuko.com/infodetail-2141669.html