当前位置：

首页
/
IT
/
程序
/
Python
/
Python 网络编程 (进程池, 进程间的通信)

Python 网络编程 (进程池, 进程间的通信)

线程池的原理:

线程池是预先创建线程的一种技术. 线程池在还没有任务到来之前,

创建一定数量的线程, 放入空闲队列中. 这些线程都是处于睡眠状态,

即均为启动, 不消耗 CPU, 而只是占用较小的内存空间. 当请求到来之后,

缓冲池给这次请求分配一个空闲线程, 把请求传入此线程中运行, 进行处理.

当预先创建的线程都处于运行状态, 即预制线程不够, 线程池可以自由创建一定数量的新线程,

用于处理更多的请求. 当系统比较闲的时候, 也可以通过移除一部分一直处于停用状态的线程.

进程间的通信原理:

OS 提供了沟通的媒介供进程之间 "对话" 用. 既然要沟通, 如同人类社会的沟通一样,

沟通要付出时间和金钱, 计算机中也一样, 必然有沟通需要付出的成本.

出于所解决问题的特性, OS 提供了多种沟通的方式, 每种方式的沟通成本也不尽相同,

使用成本和沟通效率也有所不同. 我们经常听到的管道, 消息队列, 共享内存都是 OS 提供的供进程之间对话的方式.

Process(target, name, args, kwargs)
    name:

给进程取名字

默认为 Process-1,Process-2.....

p.name 查看进程名

args:

以元组的形式给 target 函数传参

kwargs:

以字典的形式给对应键的值传参

进程对象的其他常用属性方法:

p.name  p.start()   p.join()
    p.pid:

获取创建进程的 pid 号

p.is_alive():

判断进程是处于 alive 状态

p.daemon:

默认为 Flase 如果设置为 True 主进程结束时杀死所有子进程

daemon 属性一定要在 start() 前设置

设置 daemon 为 True 一般不需要加 join()

daemon 不是真正意义上的守护进程

守护进程:

不受终端控制

后台自动运行

生命周期长

多进程 copy 一个文件拆分为两个进行保存

import os
from multiprocessing import Process
from time import sleep
# 获取文件的大小
size = os.path.getsize("./timg.jpeg")  # 获取文件的字节数
# f = open("timg.jpeg",'rb')
# 复制前半部分
def copy1(img):
    f = open(img,'rb')  # 二进制读取要复制的文件
    n = size // 2
    fw = open('1.jpeg','wb')  # 二进制创建文件
    while True:
        if n <1024:  # 判断文件大小是否大于 1024 字节 如果小于则直接读取写入
            data = f.read(n)
            fw.write(data)
            break
        data = f.read(1024)  # 否则每次循环读取 1024 字节并写入
        fw.write(data)
        n -= 1024
    f.close()
    fw.close()
# 复制后半部分
def copy2(img):
    f = open(img,'rb')  # 读取文件必须要每次读取 如果在父进程中打开文件流对像
                        # 子进程会通同时调用一个文件流对像 由于文件流对象特性会记录游标
                        # 如若先执行后半部复制这前半部会导致读取不到数据
    fw = open('2.jpeg','wb')
    f.seek(size // 2,0)
    while True:
        data = f.read(1024)
        if not data:
            break
        fw.write(data)
    fw.close()
    f.close()
p1 = Process(target = copy1,args = ('timg.jpeg',))  # 创建子进程并让子进程分别同时复制
p2 = Process(target = copy2,args = ('timg.jpeg',))
p1.start()
p2.start()
p1.join()
p2.join()
os.path.getsize('./1.txt'):

读取文件大小

注:

1. 如果多个子进程拷贝同一个父进程的对象则多个子进程

使用的是同一个对象 (如文件队形, 套接字, 队列, 管道...)

2. 如果在创建子进程后单独创建的对象, 则多个子进程各不相同

创建子自定义进程类

1. 编写类继承 Process

2. 在自定义类中加载父类__init__以获取父类属性,

同时可以自定义新的属性

3. 重写 run 方法在调用 start 时自动执行该方法

示例:

from multiprocessing import Process
import time
class ClockProcess(Process):
    def __init__(self,value):
        #调用父类 init
        super().__init__()
        self.value = value
    #重写 run 方法
    def run(self):
        for i in range(5):
            time.sleep(self.value)
            print("The time is {}".format(time.ctime()))
p = ClockProcess(2)
# 自动执行 run
p.start()
p.join()

进程的缺点:

进程在创建和销毁的过程中消耗的资源相对较多

进程池技术:

产生原因:

如果有大量的任务需要多进程完成, 而调用周期比较短且需要频繁创建

此时可能产生大量进程频繁创建销毁的情况消耗计算机资源较大

使用方法:

1. 创建进程池, 在池内放入适当数量的进程

2. 将事件封装成函数. 放入到进程池

3. 事件不断运行, 直到所有放入进程池事件运行完成

4. 关闭进程池, 回收进程

from multiprocessing import pool
    pool(Process)

功能: 创建进程池对象

参数: 进程数量

返回值: 进程池对象

pool = pool()
    pool.apply_async(fun, args, kwds)(异步执行)

功能: 将事件放入进程池内

参数:

fun: 要执行的函数

args: 以元组形式为 fun 传参

kwds: 以字典形式为 fun 传参

返回值:

返回一个事件对象, 通过 p.get() 函数可以获取 fun 的返回值

pool.close():

功能:

关闭进程池, 无法再加入新的事件, 并等待已有事件结束执行

pool.join()

功能: 回收进程池

pool.apply(fun, args, kwds)(同步执行)

功能: 将事件放入进程池内

参数:

fun: 要执行的函数

args: 以元组形式为 fun 传参

kwds: 以字典形式为 fun 传参

没有返回值

示例:

from multiprocessing import Pool
from time import sleep,ctime
def worker(msg):
    sleep(2)
    print(msg)
    return ctime()
# 创建进程池对象
pool = Pool(processes = 4)
result = []
for i in range(10):
    msg = "hello %d"%i
    #将事件放入进程池
    r = pool.apply_async(func = worker,args = (msg,))
    result.append(r)
    #同步执行
    # pool.apply(func = worker,args = (msg,))
# 关闭进程池
pool.close()
# 回收
pool.join()
# 获取事件函数返回值
for i in result:
    print(i.get())
    pool.map(func, iter)

功能:

将要执行的事件放入进程池

参数:

func 要执行的函数

iter 可迭代对象

示例:

from multiprocessing import Pool
import time
def fun(n):
    time.sleep(1)
    print("执行 pool map 事件",n)
    return n ** 2
pool = Pool(4)
# 在进程池放入 6 个事件
r = pool.map(fun,range(6))  # map 高阶函数 fun 和 iter 执行 6 次
print("返回值列表:",r)
pool.close()
pool.join()

进程间的通信 (IPC)

由于进程空间独立, 资源无法共享,

此时在进程间通讯就需要专门的通讯方法

通信方法:

管道, 消息队列, 共享内存

信号, 信号量, 套接字

管道通信:

在内存中开辟一块内存空间, 形成管道结构

多个进程使用同一个管道, 即可通过对管道的读写操作进行通讯

multiprocessing --> Pipe
   fd1,fd2 = Pipe(duplex=True)

功能: 创建管道

参数:

默认表示双向管道

如果设置为 False 则为单向管道

返回值:

俩个管道对象的, 分别表示管道的两端

如果是双向管道则均可读写

如果是单向管道则 fd1 只读, fd2 只写

fd.recv()

功能: 从管道读取信息

返回值: 读取到的内容

当管道为空则阻塞

fd.send(data)

功能: 向管道写入内容

参数: 要写入的内容

当管道满时会阻塞

可以写入几乎所有 Python 所有数据类型

队列通信:

在内存中开辟队列结构空间, 多个进程可见,

多个进程操作同一个队列对象可以实现消息存取工作

在取出时必须按照存入顺序取出 (先进先出)

q = Queue(maxsize=0)

功能:

创建队列对象

参数:

maxsize 默认表示根据系统分配空间储存消息

如果传入一个正整数则表示最多存放多少条消息

返回值: 队列对象

q.put(data,[block,timeout])

功能: 向队列存入消息

参数:

data: 存入消息 (支持 Python 数据类型)

block: 默认 True 表示当队满时阻塞

设置为 False 则为非阻塞

timeout: 当 block 为 True 是表示超时检测

data = q.get([block,timeout])

功能: 取出消息

参数:

block: 设置为 True 当队列为空时阻塞

设置为 False 表示非阻塞

timeout:

当 block 为 True 是表示超时检测

q.full() 判断队列是否为满

q.empty() 判断队列是否为空

q.qsize() 获取队列中消息的数量

q.close() 关闭队列

共享内存通信:

在内存中开辟一段空间存储数据对多个进程可见,

每次写入共享内存中的内容都会覆盖之前内容

对内存的读操作不会改变内存中的内容

form multiprocessing import Value,Array
    shm = Value(ctype,obj)

功能: 共享内存共享空间

参数:

ctype: 字符串要转换的 c 语言的数据类型

obj: 共享内存的初始数据

返回值: 返回共享内存对象

shm.value:

表示共享内存的值

示例:

from  multiprocessing import Process,Value
import time
import random
# 创建共享内存
money = Value('i',6000)
# 存钱
def deposite():
    for i in range(100):
        time.sleep(0.05)
        #对 value 的修改就是对共享内存的修改
        money.value += random.randint(1,200)
# 花销
def withdraw():
    for i in range(100):
        time.sleep(0.04)
        #对 value 的修改就是对共享内存的修改
        money.value -= random.randint(1,200)
d = Process(target = deposite)
w = Process(target = withdraw)
d.start()
w.start()
d.join()
w.join()
print(money.value)
    shm = Array(ctype,obj)

功能:

开辟共享内存空间

参数:

ctype: 要转换的数据类型

obj:

要存入共享内容的的数据 (结构化数据)

列表, 字符串表示要存入得内容

要求数据结构内的类型相同

整数表示要开辟几个单元的空间

返回值:

返回共享内存对象可迭代对象

示例:

from multiprocessing import Process,Array
import time
# 创建共享内存
shm = Array('c',b"hello") #字符类型要求是 bytes
# 开辟 5 个整形单元的共享内存空间
# shm = Array('i',5)
def fun():
    for i in shm:
        print(i)
    shm[0] = b"H"
p = Process(target = fun)
p.start()
p.join()
print(shm.value) #从首地址打印字符串
# for i in shm:
#     print(i)

三种进程间通信区别:

管道通信: 消息队列: 共享内存:

开辟空间: 内存内存内存

读写方式: 两端读写先进先出每次覆盖上次内容

单向 / 双向

效率: 一般一般较快

应用: 多用于父子进程应用灵活广泛复杂, 需要同步互斥

来源: https://www.cnblogs.com/ParisGabriel/p/9471734.html

与本文相关文章

暂无,快来抢沙发吧！