见解有限, 如有描述不当之处, 请帮忙及时指出, 如有错误, 会及时修正.
---- 超长文 + 多图预警, 需要花费不少时间.----
如果看完本文后, 还对进程线程傻傻分不清, 不清楚浏览器多进程, 浏览器内核多线程, JS 单线程, JS 运行机制的区别. 那么请回复我, 一定是我写的还不够清晰, 我来改...
---- 正文开始 ----
最近发现有不少介绍 JS 单线程运行机制的文章, 但是发现很多都仅仅是介绍某一部分的知识, 而且各个地方的说法还不统一, 容易造成困惑. 因此准备梳理这块知识点, 结合已有的认知, 基于网上的大量参考资料, 从浏览器多进程到 JS 单线程, 将 JS 引擎的运行机制系统的梳理一遍.
展现形式: 由于是属于系统梳理型, 就没有由浅入深了, 而是从头到尾的梳理知识体系, 重点是将关键节点的知识点串联起来, 而不是仅仅剖析某一部分知识.
内容是: 从浏览器进程, 再到浏览器内核运行, 再到 JS 引擎单线程, 再到 JS 事件循环机制, 从头到尾系统的梳理一遍, 摆脱碎片化, 形成一个知识体系
目标是: 看完这篇文章后, 对浏览器多进程, JS 单线程, JS 事件循环机制这些都能有一定理解, 有一个知识体系骨架, 而不是似懂非懂的感觉.
另外, 本文适合有一定经验的前端人员, 新手请规避, 避免受到过多的概念冲击. 可以先存起来, 有了一定理解后再看, 也可以分成多批次观看, 避免过度疲劳.
大纲
区分进程和线程
浏览器是多进程的
浏览器都包含哪些进程?
浏览器多进程的优势
重点是浏览器内核(渲染进程)
Browser 进程和浏览器内核 (Renderer 进程) 的通信过程
梳理浏览器内核中线程之间的关系
GUI 渲染线程与 JS 引擎线程互斥
JS 阻塞页面加载
webWorker,JS 的多线程?
WebWorker 与 SharedWorker
简单梳理下浏览器渲染流程
load 事件与 DOMContentLoaded 事件的先后
CSS 加载是否会阻塞 dom 树渲染?
普通图层和复合图层
从 Event Loop 谈 JS 的运行机制
事件循环机制进一步补充
单独说说定时器
setTimeout 而不是 setInterval
事件循环进阶: macrotask 与 microtask
写在最后的话
区分进程和线程
线程和进程区分不清, 是很多新手都会犯的错误, 没有关系. 这很正常. 先看看下面这个形象的比喻:
- 进程是一个工厂, 工厂有它的独立资源
- 工厂之间相互独立
- 线程是工厂中的工人, 多个工人协作完成任务
- 工厂内有一个或多个工人
- 工人之间共享空间
再完善完善概念:
- 工厂的资源 -> 系统分配的内存(独立的一块内存)
- 工厂之间的相互独立 -> 进程之间相互独立
- 多个工人协作完成任务 -> 多个线程在进程中协作完成任务
- 工厂内有一个或多个工人 -> 一个进程由一个或多个线程组成
- 工人之间共享空间 -> 同一进程下的各个线程之间共享程序的内存空间(包括代码段, 数据集, 堆等)
然后再巩固下:
如果是 Windows 电脑中, 可以打开任务管理器, 可以看到有一个后台进程列表. 对, 那里就是查看进程的地方, 而且可以看到每个进程的内存资源信息以及 CPU 占有率.
image
所以, 应该更容易理解了: 进程是 CPU 资源分配的最小单位(系统会给它分配内存)
最后, 再用较为官方的术语描述一遍:
进程是 CPU 资源分配的最小单位(是能拥有资源和独立运行的最小单位)
线程是 CPU 调度的最小单位(线程是建立在进程的基础上的一次程序运行单位, 一个进程中可以有多个线程)
tips
不同进程之间也可以通信, 不过代价较大
现在, 一般通用的叫法: 单线程与多线程, 都是指在一个进程内的单和多.(所以核心还是得属于一个进程才行)
浏览器是多进程的
理解了进程与线程了区别后, 接下来对浏览器进行一定程度上的认识:(先看下简化理解)
浏览器是多进程的
浏览器之所以能够运行, 是因为系统给它的进程分配了资源(CPU, 内存)
简单点理解, 每打开一个 Tab 页, 就相当于创建了一个独立的浏览器进程.
关于以上几点的验证, 请再第一张图:
image
图中打开了 Chrome 浏览器的多个标签页, 然后可以在 Chrome 的任务管理器中看到有多个进程(分别是每一个 Tab 页面有一个独立的进程, 以及一个主进程). 感兴趣的可以自行尝试下, 如果再多打开一个 Tab 页, 进程正常会 + 1 以上(不过, 某些版本的 IE 却是单进程的)
注意: 在这里浏览器应该也有自己的优化机制, 有时候打开多个 tab 页后, 可以在 Chrome 任务管理器中看到, 有些进程被合并了 (所以每一个 Tab 标签对应一个进程并不一定是绝对的)
浏览器都包含哪些进程?
知道了浏览器是多进程后, 再来看看它到底包含哪些进程:(为了简化理解, 仅列举主要进程)
Browser 进程: 浏览器的主进程(负责协调, 主控), 只有一个. 作用有
负责浏览器界面显示, 与用户交互. 如前进, 后退等
负责各个页面的管理, 创建和销毁其他进程
将 Renderer 进程得到的内存中的 Bitmap, 绘制到用户界面上
网络资源的管理, 下载等
第三方插件进程: 每种类型的插件对应一个进程, 仅当使用该插件时才创建
GPU 进程: 最多一个, 用于 3D 绘制等
浏览器渲染进程(浏览器内核)(Renderer 进程, 内部是多线程的): 默认每个 Tab 页面一个进程, 互不影响. 主要作用为
页面渲染, 脚本执行, 事件处理等
强化记忆: 在浏览器中打开一个网页相当于新起了一个进程(进程内有自己的多线程)
当然, 浏览器有时会将多个进程合并(譬如打开多个空白标签页后, 会发现多个空白标签页被合并成了一个进程), 如图
image
另外, 可以通过 Chrome 的更多工具 -> 任务管理器自行验证
浏览器多进程的优势
相比于单进程浏览器, 多进程有如下优点:
避免单个 page crash 影响整个浏览器
避免第三方插件 crash 影响整个浏览器
多进程充分利用多核优势
方便使用沙盒模型隔离插件等进程, 提高浏览器稳定性
简单点理解: 如果浏览器是单进程, 那么某个 Tab 页崩溃了, 就影响了整个浏览器, 体验有多差; 同理如果是单进程, 插件崩溃了也会影响整个浏览器; 而且多进程还有其它的诸多优势...
当然, 内存等资源消耗也会更大, 有点空间换时间的意思.
重点是浏览器内核(渲染进程)
重点来了, 我们可以看到, 上面提到了这么多的进程, 那么, 对于普通的前端操作来说, 最终要的是什么呢? 答案是渲染进程
可以这样理解, 页面的渲染, JS 的执行, 事件的循环, 都在这个进程内进行. 接下来重点分析这个进程
请牢记, 浏览器的渲染进程是多线程的(这点如果不理解, 请回头看进程和线程的区分)
终于到了线程这个概念了, 好亲切. 那么接下来看看它都包含了哪些线程(列举一些主要常驻线程):
GUI 渲染线程
负责渲染浏览器界面, 解析 html,CSS, 构建 DOM 树和 RenderObject 树, 布局和绘制等.
当界面需要重绘 (Repaint) 或由于某种操作引发回流 (reflow) 时, 该线程就会执行
注意, GUI 渲染线程与 JS 引擎线程是互斥的, 当 JS 引擎执行时 GUI 线程会被挂起(相当于被冻结了),GUI 更新会被保存在一个队列中等到 JS 引擎空闲时立即被执行.
JS 引擎线程
也称为 JS 内核, 负责处理 JavaScript 脚本程序.(例如 V8 引擎)
JS 引擎线程负责解析 JavaScript 脚本, 运行代码.
JS 引擎一直等待着任务队列中任务的到来, 然后加以处理, 一个 Tab 页 (renderer 进程) 中无论什么时候都只有一个 JS 线程在运行 JS 程序
同样注意, GUI 渲染线程与 JS 引擎线程是互斥的, 所以如果 JS 执行的时间过长, 这样就会造成页面的渲染不连贯, 导致页面渲染加载阻塞.
事件触发线程
归属于浏览器而不是 JS 引擎, 用来控制事件循环(可以理解, JS 引擎自己都忙不过来, 需要浏览器另开线程协助)
当 JS 引擎执行代码块如 setTimeOut 时(也可来自浏览器内核的其他线程, 如鼠标点击, Ajax 异步请求等), 会将对应任务添加到事件线程中
当对应的事件符合触发条件被触发时, 该线程会把事件添加到待处理队列的队尾, 等待 JS 引擎的处理
注意, 由于 JS 的单线程关系, 所以这些待处理队列中的事件都得排队等待 JS 引擎处理(当 JS 引擎空闲时才会去执行)
定时触发器线程
传说中的 setInterval 与 setTimeout 所在线程
浏览器定时计数器并不是由 JavaScript 引擎计数的,(因为 JavaScript 引擎是单线程的, 如果处于阻塞线程状态就会影响记计时的准确)
因此通过单独线程来计时并触发定时(计时完毕后, 添加到事件队列中, 等待 JS 引擎空闲后执行)
注意, W3C 在 HTML 标准中规定, 规定要求 setTimeout 中低于 4ms 的时间间隔算为 4ms.
异步 http 请求线程
在 XMLHttpRequest 在连接后是通过浏览器新开一个线程请求
将检测到状态变更时, 如果设置有回调函数, 异步线程就产生状态变更事件, 将这个回调再放入事件队列中. 再由 JavaScript 引擎执行.
看到这里, 如果觉得累了, 可以先休息下, 这些概念需要被消化, 毕竟后续将提到的事件循环机制就是基于事件触发线程的, 所以如果仅仅是看某个碎片化知识, 可能会有一种似懂非懂的感觉. 要完成的梳理一遍才能快速沉淀, 不易遗忘. 放张图巩固下吧:
image
再说一点, 为什么 JS 引擎是单线程的? 额, 这个问题其实应该没有标准答案, 譬如, 可能仅仅是因为由于多线程的复杂性, 譬如多线程操作一般要加锁, 因此最初设计时选择了单线程...
Browser 进程和浏览器内核 (Renderer 进程) 的通信过程
看到这里, 首先, 应该对浏览器内的进程和线程都有一定理解了, 那么接下来, 再谈谈浏览器的 Browser 进程 (控制进程) 是如何和内核通信的, 这点也理解后, 就可以将这部分的知识串联起来, 从头到尾有一个完整的概念.
如果自己打开任务管理器, 然后打开一个浏览器, 就可以看到: 任务管理器中出现了两个进程(一个是主控进程, 一个则是打开 Tab 页的渲染进程), 然后在这前提下, 看下整个的过程:(简化了很多)
Browser 进程收到用户请求, 首先需要获取页面内容(譬如通过网络下载资源), 随后将该任务通过 RendererHost 接口传递给 Render 进程
Renderer 进程的 Renderer 接口收到消息, 简单解释后, 交给渲染线程, 然后开始渲染
渲染线程接收请求, 加载网页并渲染网页, 这其中可能需要 Browser 进程获取资源和需要 GPU 进程来帮助渲染
当然可能会有 JS 线程操作 DOM(这样可能会造成回流并重绘)
最后 Render 进程将结果传递给 Browser 进程
Browser 进程接收到结果并将结果绘制出来
这里绘一张简单的图:(很简化)
image
看完这一整套流程, 应该对浏览器的运作有了一定理解了, 这样有了知识架构的基础后, 后续就方便往上填充内容.
这块再往深处讲的话就涉及到浏览器内核源码解析了, 不属于本文范围.
如果这一块要深挖, 建议去读一些浏览器内核源码解析文章, 或者可以先看看参考下来源中的第一篇文章, 写的不错
梳理浏览器内核中线程之间的关系
到了这里, 已经对浏览器的运行有了一个整体的概念, 接下来, 先简单梳理一些概念
GUI 渲染线程与 JS 引擎线程互斥
由于 JavaScript 是可操纵 DOM 的, 如果在修改这些元素属性同时渲染界面(即 JS 线程和 UI 线程同时运行), 那么渲染线程前后获得的元素数据就可能不一致了.
因此为了防止渲染出现不可预期的结果, 浏览器设置 GUI 渲染线程与 JS 引擎为互斥的关系, 当 JS 引擎执行时 GUI 线程会被挂起, GUI 更新则会被保存在一个队列中等到 JS 引擎线程空闲时立即被执行.
JS 阻塞页面加载
从上述的互斥关系, 可以推导出, JS 如果执行时间过长就会阻塞页面.
譬如, 假设 JS 引擎正在进行巨量的计算, 此时就算 GUI 有更新, 也会被保存到队列中, 等待 JS 引擎空闲后执行. 然后, 由于巨量计算, 所以 JS 引擎很可能很久很久后才能空闲, 自然会感觉到巨卡无比.
所以, 要尽量避免 JS 执行时间过长, 这样就会造成页面的渲染不连贯, 导致页面渲染加载阻塞的感觉.
WebWorker,JS 的多线程?
前文中有提到 JS 引擎是单线程的, 而且 JS 执行时间过长会阻塞页面, 那么 JS 就真的对 CPU 密集型计算无能为力么?
所以, 后来 HTML5 中支持了 Web Worker.
MDN 的官方解释是:
Web Worker 为 Web 内容在后台线程中运行脚本提供了一种简单的方法. 线程可以执行任务而不干扰用户界面
一个 worker 是使用一个构造函数创建的一个对象(e.g. Worker()) 运行一个命名的 JavaScript 文件
这个文件包含将在工作线程中运行的代码; workers 运行在另一个全局上下文中, 不同于当前的 Windows
因此, 使用 Windows 快捷方式获取当前全局的范围 (而不是 self) 在一个 Worker 内将返回错误
这样理解下:
创建 Worker 时, JS 引擎向浏览器申请开一个子线程(子线程是浏览器开的, 完全受主线程控制, 而且不能操作 DOM)
JS 引擎线程与 worker 线程间通过特定的方式通信(postMessage API, 需要通过序列化对象来与线程交互特定的数据)
所以, 如果有非常耗时的工作, 请单独开一个 Worker 线程, 这样里面不管如何翻天覆地都不会影响 JS 引擎主线程, 只待计算出结果后, 将结果通信给主线程即可, perfect!
而且注意下, JS 引擎是单线程的, 这一点的本质仍然未改变, Worker 可以理解是浏览器给 JS 引擎开的外挂, 专门用来解决那些大量计算问题.
其它, 关于 Worker 的详解就不是本文的范畴了, 因此不再赘述.
WebWorker 与 SharedWorker
既然都到了这里, 就再提一下 SharedWorker(避免后续将这两个概念搞混)
WebWorker 只属于某个页面, 不会和其他页面的 Render 进程 (浏览器内核进程) 共享
所以 Chrome 在 Render 进程中 (每一个 Tab 页就是一个 render 进程) 创建一个新的线程来运行 Worker 中的 JavaScript 程序.
SharedWorker 是浏览器所有页面共享的, 不能采用与 Worker 同样的方式实现, 因为它不隶属于某个 Render 进程, 可以为多个 Render 进程共享使用
所以 Chrome 浏览器为 SharedWorker 单独创建一个进程来运行 JavaScript 程序, 在浏览器中每个相同的 JavaScript 只存在一个 SharedWorker 进程, 不管它被创建多少次.
看到这里, 应该就很容易明白了, 本质上就是进程和线程的区别. SharedWorker 由独立的进程管理, WebWorker 只是属于 render 进程下的一个线程
简单梳理下浏览器渲染流程
本来是直接计划开始谈 JS 运行机制的, 但想了想, 既然上述都一直在谈浏览器, 直接跳到 JS 可能再突兀, 因此, 中间再补充下浏览器的渲染流程(简单版本)
为了简化理解, 前期工作直接省略成:(要展开的或完全可以写另一篇超长文)
- 浏览器输入 url, 浏览器主进程接管, 开一个下载线程,
然后进行 http 请求(略去 DNS 查询, IP 寻址等等操作), 然后等待响应, 获取内容,
随后将内容通过 RendererHost 接口转交给 Renderer 进程
- 浏览器渲染流程开始
浏览器器内核拿到内容后, 渲染大概可以划分成以下几个步骤:
解析 HTML 建立 dom 树
解析 CSS 构建 render 树(将 CSS 代码解析成树形的数据结构, 然后结合 DOM 合并成 render 树)
布局 render 树(Layout/reflow), 负责各元素尺寸, 位置的计算
绘制 render 树(paint), 绘制页面像素信息
浏览器会将各层的信息发送给 GPU,GPU 会将各层合成(composite), 显示在屏幕上.
所有详细步骤都已经略去, 渲染完毕后就是 load 事件了, 之后就是自己的 JS 逻辑处理了
既然略去了一些详细的步骤, 那么就提一些可能需要注意的细节把.
- setTimeout(function(){
- console.log('hello!');
- }, 1000);
- setTimeout(function(){
- console.log('hello!');
- }, 0);
- console.log('begin');
- console.log('script start');
- setTimeout(function() {
- console.log('setTimeout');
- }, 0);
- Promise.resolve().then(function() {
- console.log('promise1');
- }).then(function() {
- console.log('promise2');
- });
- console.log('script end');
- script start
- script end
- promise1
- promise2
- setTimeout
- var counter = 1
- var observer = new MutationObserver(nextTickHandler)
- var textNode = document.createTextNode(String(counter))
- observer.observe(textNode, {
- characterData: true
- })
- timerFunc = () => {
- counter = (counter + 1) % 2
- textNode.data = String(counter)
- }
来源: http://www.jianshu.com/p/a0e57c408ae0