Redian新闻
>
Python多进程学习

Python多进程学习

公众号新闻

Python 多进程 (Multiprocessing) 是一种同时利用计算机多个处理器核心 (CPU cores) 进行并行处理的技术,它与 Python 的多线程 (Multithreading) 技术不同,因为多线程的并发任务依赖于一个 GIL (Global Interpreter Lock)。在多进程中,每个进程都有自己的解释器进程,并且可以同时使用多个 CPU 核心,因此在处理计算密集型任务时比多线程更有效。

要使用 Python 的多进程,我们需要使用内置的 multiprocessing 模块,该模块提供了创建和管理进程的类和函数,下面是一个简单的 Python 多进程的例子:

import multiprocessing

def worker():
   """子进程的工作函数"""
   print("Starting worker")
   # 这里可以放一些耗时的任务
   print("Finished worker")

if __name__ == '__main__':
   # 创建一个子进程
   p = multiprocessing.Process(target=worker)
   # 启动子进程
   p.start()
   # 等待子进程结束
   p.join()
   print("Parent process finished")

在这个例子中,我们定义了一个函数 worker(),这个函数是子进程要执行的任务,我们使用 multiprocessing.Process 类创建了一个子进程,并将 worker() 函数作为参数传递给 target 参数,然后我们使用 start() 方法启动子进程,join() 方法等待子进程完成,最后,主进程会输出一条消息,表示自己已经完成了。

除了创建单个子进程,我们还可以使用 Pool 类来创建多个子进程,以便并行处理多个任务,下面是一个使用 Pool 类的例子:

import multiprocessing

def worker(num):
   """子进程的工作函数"""
   print(f"Starting worker {num}")
   # 这里可以放一些耗时的任务
   print(f"Finished worker {num}")

if __name__ == '__main__':
   # 创建一个包含 4 个进程的进程池
   with multiprocessing.Pool(processes=4as pool:
       # 使用 map 函数并行执行 worker 函数
       pool.map(worker, [1234])
   print("Parent process finished")

在这个例子中,我们使用 Pool 类创建了一个包含 4 个进程的进程池,然后我们使用 map() 方法并行执行 worker() 函数。map() 方法会将参数列表中的每个参数依次传递给 worker() 函数,并将返回值收集到一个列表中。最后,主进程会输出一条消息,表示自己已经完成了。

当我们需要执行一些计算密集型的任务时,使用 Python 的多进程技术可以显著提高程序的执行效率,下面是一些使用 Python 的多进程技术的常见场景:

  1. 数据处理:当我们需要处理大量的数据时,可以使用多进程技术将数据分成多个部分,并同时处理它们。

  2. 网络爬虫:当我们需要爬取大量的网页时,可以使用多进程技术将不同的任务分配给不同的进程,从而并行地执行它们。

  3. 图像处理:当我们需要对大量的图像进行处理时,可以使用多进程技术并行执行不同的处理任务。

在使用 Python 的多进程技术时,我们需要注意一些问题:

  1. 进程间通信:由于每个进程都有自己的内存空间,因此它们之间不能直接共享数据,我们需要使用 multiprocessing 模块提供的管道、队列等机制来实现进程间通信。

  2. 进程池:在使用 Pool 类时,我们需要注意控制并发任务的数量,以免占用过多的系统资源。

  3. 内存限制:由于每个进程都有自己的内存空间,因此如果同时创建太多的进程,会占用过多的系统内存,导致程序崩溃。

下面是一个使用进程池并行执行任务的例子,其中使用了 imap_unordered() 方法来异步执行任务:

import multiprocessing
import time

def square(x):
   """计算平方"""
   time.sleep(1)  # 模拟耗时的计算
   return x * x

if __name__ == '__main__':
   # 创建进程池
   with multiprocessing.Pool() as pool:
       # 异步执行任务
       for result in pool.imap_unordered(squarerange(10)):
           print(result)

在这个例子中,我们创建了一个包含默认进程数的进程池,然后使用 imap_unordered() 方法并行执行 square() 函数。imap_unordered() 方法会返回一个迭代器,每次迭代都会返回一个已经完成的任务的结果。由于我们使用了异步执行,因此任务的返回顺序不一定与参数的顺序相同。

除了使用 imap_unordered() 方法,我们还可以使用 imap() 方法,它会按照参数的顺序返回任务的结果,此外,我们还可以使用 apply()apply_async() 方法来执行单个任务或异步执行单个任务。

总的来说,使用 Python 的多进程技术可以帮助我们更有效地处理计算密集型任务,通过使用 multiprocessing 模块和 Pool 类,我们可以轻松地创建和管理多个子进程,并使它们并行地执行任务。

文章来源于网络,版权归原作者所有,侵删。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《Python机器学习》畅销书作者又出新书了,全方位扩展你的机器学习知识麻省理工Python增强编译器Codon 让Python像C\\C++一样高效火爆北美的少儿Python编程课免费领!英文授课,藤校师资,科技史代让孩子领先一步!从零开始的python教程(1):全面又好用的学习资料5个常见运维场景,用这几个Python脚本就够了!武则天第1次宠幸薛怀义后,为何激动到难以自拔?有了这 5 个自动化运维场景,让你用 Python 写脚本更爽!为什么Python如此受欢迎?一篇关于使用Python实现财务报表自动化的实用指南Python上线最新证书:可直接挂LinkedIn、留学生7天能拿!小白速成!清华大学出品《Python漫画教学书》!零基础留学生速领如何在 Ubuntu 和其他 Linux 下安装 IDLE Python IDE | Linux 中国小白速成!清华大学出品《Python漫画教学书》,零基础码住!Go/Rust挑战Java/Python地位为什么 Python 如此受欢迎?这款编译器能让Python和C++一样快:最高提速百倍,MIT出品终身仁慈独裁者、Python之父龟叔,曾被认为最不可能发明自己的编程语言这款编译器能让Python和C++一样快!最高提速百倍,MIT出品!《狂飙》中,张译和张颂文的片酬差距有多大? 哇!吓死人了喽!看完哈佛学霸收藏的Python课程,才懂得人和人的差距趣图:我是一个 Python 开发者爆料一个Python圈子里的小道消息...Python 中的变量:概念与示例 | Linux 中国3天速成!清华大学出品《Python漫画教学书》!零基础留学生码住Flask之父凭一己之力击败各种GPT,称Python包管理比LLM更火热轻松啃下砖头!5分钟精读带你入门Python神作小鳄鱼!(第一周)送新书!《Python深度学习基于Torch/TF(第2版)》,有ChatGPT拓展让 Python 拥有 C/C++ 一样的速度,编译神器 Codon 发布!说说知道的工科翻译书籍或文章Artipie:可用于 Python 的开源仓库管理器 | Linux 中国豪斯曼:《诗歌外编》: 第十七首:命运还没有把最坏的给我Python官宣:这张可挂LinkedIn的证书,留学生7天可拿Ruff创始人宣布成立公司,称要改变Python生态太炸裂了!做Python私活赚得比主业还多!有没有老师现在敢给高三学生讲这玩意儿, 这可全是“钱”啊!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。