Rust 入坑指南: 齐头并进 (下)

前文中我们聊了 Rust 如何管理线程以及如何利用 Rust 中的锁进行编程. 今天我们继续学习并发编程,

原子类型

许多编程语言都会提供原子类型, Rust 也不例外, 在前文中我们聊了 Rust 中锁的使用, 有了锁, 就要小心死锁的问题, Rust 虽然声称是安全并发, 但是仍然无法帮助我们解决死锁的问题. 原子类型就是编程语言为我们提供的无锁并发编程的最佳手段. 熟悉 Java 的同学应该知道, Java 的编译器并不能保证代码的执行顺序, 编译器会对我们的代码的执行顺序进行优化, 这一操作成为指令重排. 而 Rust 的多线程内存模型不会进行指令重排, 它可以保证指令的执行顺序.

通常来讲原子类型会提供以下操作:

Load: 从原子类型读取值

Store: 为一个原子类型写入值

CAS(Compare-And-Swap): 比较并交换

Swap: 交换

Fetch-add(sub/and/or): 表示一系列的原子的加减或逻辑运算

Ok, 这些基础的概念聊完以后, 我们就来看看 Rust 为我们提供了哪些原子类型. Rust 的原子类型定义在标准库 std::sync::atomic 中, 目前它提供了 12 种原子类型.

下面这段代码是 Rust 演示了如何用原子类型实现一个自旋锁.

use std::sync::Arc;
use std::sync::atomic::{AtomicUsize, Ordering};
use std::thread;
fn main() {
    let spinlock = Arc::new(AtomicUsize::new(1));
    let spinlock_clone = spinlock.clone();
    let thread = thread::spawn(move|| {
        spinlock_clone.store(0, Ordering::SeqCst);
    });
    while spinlock.load(Ordering::SeqCst) != 0 {}
    if let Err(panic) = thread.join() {
        println!("Thread had an error: {:?}", panic);
    }
}

我们利用 AtomicUsize 的 store 方法将它的值设置为 0, 然后用 load 方法获取到它的值, 如果不是 0, 则程序一直空转. 在 store 和 load 方法中, 我们都用到了一个参数: Ordering::SeqCst, 在声明中能看出来它也是属于 atomic 包.

我们在文档中发现它是一个枚举. 其定义为

pub enum Ordering {
    Relaxed,
    Release,
    Acquire,
    AcqRel,
    SeqCst,
}

它的作用是将内存顺序的控制权交给开发者, 我们可以自己定义底层的内存排序. 下面我们一起来看一下这 5 种排序分别代表什么意思

Relaxed: 表示「没有顺序」, 也就是开发者不会干预线程顺序, 线程只进行原子操作

Release: 对于使用 Release 的 store 操作, 在它之前所有使用 Acquire 的 load 操作都是可见的

Acquire: 对于使用 Acquire 的 load 操作, 在它之前的所有使用 Release 的 store 操作也都是可见的

AcqRel: 它代表读时使用 Acquire 顺序的 load 操作, 写时使用 Release 顺序的 store 操作

SeqCst: 使用了 SeqCst 的原子操作都必须先存储, 再加载.

一般情况下建议使用 SeqCst, 而不推荐使用 Relaxed.

线程间通信

Go 语言文档中有这样一句话: 不要使用共享内存来通信, 应该使用通信实现共享内存.

Rust 标准库选择了 CSP 并发模型, 也就是依赖 channel 来进行线程间的通信. 它的定义是在标准库 std::sync::mpsc 中, 里面定义了三种类型的 CSP 进程:

Sender: 发送异步消息

SyncSender: 发送同步消息

Receiver: 用于接收消息

我们通过一个栗子来看一下 channel 是如何创建并收发消息的.

use std::thread;
use std::sync::mpsc;
fn main() {
    let (tx, rx) = mpsc::channel();
    thread::spawn(move || {
        let val = String::from("hi");
        tx.send(val).unwrap();
    });
    let received = rx.recv().unwrap();
    println!("Got: {}", received);
}

首先, 我们先是使用了 channel()函数来创建一个 channel, 它会返回一个 (Sender, Receiver) 元组. 它的缓冲区是无界的. 此外, 我们还可以使用 sync_channel()来创建 channel, 它返回的则是 (SyncSender, Receiver) 元组, 这样的 channel 发送消息是同步的, 并且可以设置缓冲区大小.

接着, 在子线程中, 我们定义了一个字符串变量, 并使用 send()函数向 channel 中发送消息. 这里 send 返回的是一个 Result 类型, 所以使用 unwrap 来传播错误.

在 main 函数最后, 我们又用 recv()函数来接收消息.

这里需要注意的是, send()函数会转移所有权, 所以, 如果你在发送消息之后再使用 val 变量时, 程序就会报错.

现在我们已经掌握了使用 Channel 进行线程间通信的方法了, 这里还有一段代码, 感兴趣的同学可以自己执行一下这段代码看是否能够顺利执行. 如果不能, 应该怎么修改这段代码呢?

use std::thread;
use std::sync::mpsc;
fn main() {
    let (tx, rx) = mpsc::channel();
    for i in 0..5 {
        let tx = tx.clone();
        thread::spawn(move || {
            tx.send(i).unwrap();
        });
    }
    for rx in rx.iter() {
        println!("{:?}", j);
    }
}

线程池

在实际工作中, 如果每次都要创建新的线程, 每次创建, 销毁线程的开销就会变得非常可观, 甚至会成为系统性能的瓶颈. 对于这种问题, 我们通常使用线程池来解决.

Rust 的标准库中没有现成的线程池给我们使用, 不过还是有一些第三方库来支持的. 这里我使用的是 https://crates.io/crates/threadpool .

首先需要在 Cargo.toml 中增加依赖 threadpool = "1.7.1". 然后就可以使用 use threadpool::ThreadPool; 将 ThreadPool 引入我们的程序中了.

use threadpool::ThreadPool;
use std::sync::mpsc::channel;
fn main() {
    let n_workers = 4;
    let n_jobs = 8;
    let pool = ThreadPool::new(n_workers);
    let (tx, rx) = channel();
    for _ in 0..n_jobs {
        let tx = tx.clone();
        pool.execute(move|| {
            tx.send(1).expect("channel will be there waiting for the pool");
        });
    }
    assert_eq!(rx.iter().take(n_jobs).fold(0, |a, b| a + b), 8);
}

这里我们使用 ThreadPool::new()来创建一个线程池, 初始化 4 个工作线程. 使用时用 execute()方法就可以拿出一个线程来进行具体的工作.

总结

今天我们介绍了 Rust 并发编程的三种特性: 原子类型, 线程间通信和线程池的使用.

原子类型是我们进行无锁并发的重要手段, 线程间通信和线程池也都是工作中所必须使用的. 当然并发编程的知识远不止于此, 大家有兴趣的可以自行学习也可以与我交流讨论.

来源: https://www.cnblogs.com/Jackeyzhe/p/12563384.html

与本文相关文章

暂无,快来抢沙发吧！