CSP vs Actor Go vs Erlang

源于从 Erlang 到 Go 的一些思维碰撞, 就像当初从 C++ 到 Erlang 一样, 整理下来记于此.

Actor

Actor 模型, 又叫参与者模型, 其 "一切皆参与者(actor)" 的理念与面向对象编程的 "一切皆是对象" 类似, 但是面向对象编程中对象的交互通常是顺序执行的(占用的是调用方的时间片, 是否并发由调用方决定), 而 Actor 模型中 actor 的交互是并行执行的(不占用调用方的时间片, 是否并发由自己决定).

在 Actor 模型中, actor 执行体是第一类对象, 每个 actor 都有自己的 ID(类比人的身份证), 可以被传递. actor 的交互通过发送消息来完成, 每个 actor 都有一个通信信箱(mailbox, 本质上是 FIFO 消息队列), 用于保存已经收到但尚未被处理的消息. actorA 要向 actorB 发消息, 只需持有 actorB ID, 发送的消息将被立即 Push 到 actorB 的消息信箱尾部, 然后返回. 因此 Actor 的通信原语是异步的.

从 actor 自身来说, 它的行为模式可简化为:

发送消息给其它的 actor

接收并处理消息, 更新自己的状态

创建其它的 actor

一个好的 Actor 模型实现的设计目标:

调度器: 实现 actor 的公平调度

容错性: 具备良好的容错性和完善错误处理机制

扩展性: 屏蔽 actor 通信细节, 统一本地 actor 和远程 actor 的通信方式, 进而提供分布式支持

热更新? (还没弄清楚热更新和 Actor 模型, 函数式范式的关联性)

在 Actor 模型上, Erlang 已经耕耘三十余载, 以上提到的各个方面都有非常出色的表现, 其 OTP 整合了在 Actor 模型上的最佳实践, 是 Actor 模型的标杆.

CSP

顺序通信进程 (Communicating sequential processes,CSP) 和 Actor 模型一样, 都由独立的, 并发的执行实体 (process) 构成, 执行实体间通过消息进行通信. 但 CSP 模型并不关注实体本身, 而关注发送消息使用的通道 (channel), 在 CSP 中, channel 是第一类对象, process 只管向 channel 写入或读取消息, 并不知道也不关心 channel 的另一端是谁在处理. channel 和 process 是解耦的, 可以单独创建和读写, 一个 process 可以读写(订阅) 个 channel, 同样一个 channel 也可被多个 process 读写(订阅).

对每个 process 来说:

从命名 channel 取出并处理消息

向命名 channel 写入消息

创建新的 process

Go 语言并没有完全实现 CSP 理论(参见知乎讨论 https://www.zhihu.com/question/26192499 ), 只提取了 CSP 的 process 和 channel 的概念为并发提供理论支持. 目前 Go 已经是 CSP 的代表性语言.

CSP vs Actor

相同的宗旨:"不要通过共享内存来通信, 而应该通过通信来共享内存"

两者都有独立的, 并发执行的通信实体

Actor 第一类对象为执行实体(actor),CSP 第一类对象为通信介质(channel)

Actor 中实体和通信介质是紧耦合的, 一个 Actor 持有一个 Mailbox, 而 CSP 中 process 和 channel 是解耦的, 没有从属关系. 从这一层来说, CSP 更加灵活

Actor 模型中 actor 是主体, mailbox 是匿名的, CSP 模型中 channel 是主体, process 是匿名的. 从这一层来说, 由于 Actor 不关心通信介质, 底层通信对应用层是透明的. 因此在分布式和容错方面更有优势

Go vs Erlang

以上 CSP vs Actor

均实现了语言级的 coroutine, 在阻塞时能自动让出调度资源, 在可执行时重新接受调度

go 的 channel 是有容量限制的, 因此只能一定程度地异步(本质上仍然是同步的),erlang 的 mailbox 是无限制的(也带来了消息队列膨胀的风险), 并且 erlang 并不保证消息是否能到达和被正确处理(但保证消息顺序), 是纯粹的异步语义, actor 之间做到完全解耦, 奠定其在分布式和容错方面的基础

erlang/otp 在 actor 上扩展了分布式(支持异质节点), 热更和高容错, go 在这些方面还有一段路要走(受限于 channel, 想要在语言级别支持分布式是比较困难的)

go 在消息流控上要做得更好, 因为 channel 的两个特性: 有容量限制并独立于 goroutine 存在. 前者可以控制消息流量并反馈消息处理进度, 后者让 goroutine 本身有更高的处理灵活性. 典型的应用场景是扇入扇出, Boss-Worker 等. 相比 go,erlang 进程总是被动低处理消息, 如果要做流控, 需要自己做消息进度反馈和队列控制, 灵活性要差很多. 另外一个例子就是 erlang 的 receive 操作需要遍历消息队列(参考 http://www.jianshu.com/p/41f2e943c795 ), 而如果用 go 做同步调用, 通过单独的 channel 来做则更优雅高效

Actor in Go

在用 Go 写 GS 框架时, 不自觉地会将 goroutine 封装为 actor 来使用:

GS 的执行实体 (如玩家, 公会) 的逻辑具备强状态和功能聚合性, 不易拆分, 因此通常是一个实体一个 goroutine

实体接收的逻辑消息具备弱优先级, 高顺序性的特点, 因此通常实体只会暴露一个 Channel 与其它实体交互 (结合 go 的 interface{} 很容易统一 channel 类型), 这个 channel 称为 RPC channel, 它就像这个 goroutine 的 ID, 几乎所有逻辑 goroutine 之间通过它进行交互

除此之外, 实体还有一些特殊的 channel, 如定时器, 外部命令等. 实体 goroutine 对这些 channel 执行 select 操作, 读出消息进行处理

加上 goroutine 的状态数据之后, 此时的 goroutine 的行为与 actor 相似: 接收消息(多个消息源), 处理消息, 更新状态数据, 向其它 goroutine 发送消息(通过 RPC channel)

到目前为止, goroutine 和 channel 解耦的优势并未体现出来, 我认为主要的原因仍然是 GS 执行实体的强状态性和对异步交互流程的顺序性导致的.

在研究这个问题的过程中, 发现已经有人已经用 go 实现了 Actor 模型: https://github.com/AsynkronIT/protoactor-go. 支持分布式, 甚至 supervisor, 整体思想和用法和 erlang 非常像, 真是有种他山逢知音的感觉.:)

参考:

https://www.zhihu.com/question/26192499
http://wudaijun.com/2017/05/go-vs-erlang/

来源: http://www.bubuko.com/infodetail-2977873.html

与本文相关文章

暂无,快来抢沙发吧！