ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

[python 并行1]简介

2019-12-15 15:58:06  阅读:232  来源: 互联网

标签:python 简介 并行 任务 线程 进程 密集型 多线程 CPU


并行编程-介绍篇

设计并行编程 1

任务分解:将程序分解为任务,在不同处理器上执行以实现并行化。(可以使用以下两种方法)

  • 领域分解:将问题数据分解 (当处理的数据量很大时,分开处理)
  • 功能性分解:将问题分解为任务 (把大的任务分解为多个小任务处理)

任务分配:将任务分配到各个处理器上 (目的是负载均衡

聚集:将小任务与大任务合并到一起从而改进性能的过程
如果任务数量远远超过可用的处理器数量,由于线程切换等其它因素会导致效率降低
如果计算机有针对大量小任务而进行特别的设计,如采用GPU计算,那将能从大量小任务的运行中获益

映射:指定哪个任务将要执行 (目标是将总执行时间降到最低)(可以使用以下2中策略,这2个策略间由于是冲突的,需要做出权衡)

  • 通信频繁的任务放在同一个处理器中来增加局部性
  • 可以并发执行的任务放在不同的处理器中增加并发性

注意! 映射问题,即NP完备 2。对于相同大小的任务,很容易直接映射
如果是每个任务的工作量千差万别,就需要采用负载均衡算法在运行期间确定聚集与映射的策略。
如果在程序执行期间通信量或任务量发生变化的情况,可以使用动态的负载均衡算法

(不同的问题存在多种负载均衡算法,有全局或局部的。全局算法需要全局的掌握,会增加大量成本。局部算法只依赖于特定任务本身的信息,不过难以找到最优)
(存在 管理者/执行者(管理者调度)、层次化的管理者/执行者(分组,每组都有个管理者调度)、去中心化的模型(每个处理器会维护自己的任务池))


进程与线程比较 3

性能比较

多线程比多进程成本低,但性能更低

优缺点对比

多进程优点

  • 每个进程相互独立,子进程异常不影响父进程
  • 通过增加CPU,就可容易扩充性能
  • 没有锁的影响
  • 每个子进程都有独立的地址空间和资源

    多进程缺点

  • 逻辑控制复杂,需要和主进程交互
  • 需要跨进程边界,如有大量数据需要传输不太好,适合少量数据传输、密集运算

多线程优点

  • 逻辑控制简单
  • 需跨进程边界
  • 可直接共享资源
  • 资源消耗比进程

    多线程缺点

  • 其中的某个线程崩溃可能会影响整个程序
  • 线程之间的同步和的控制比较麻烦
  • 每个线程与主线程共用地址空间

注意! 无论进程,还是线程多了以后,他们的调度也会消耗较多的CPU资源


python并行编程的问题

一般来说,一个进程可以包含多个并行线程。不过,Python解释器并非完全是线程安全的。为了支持多线程的Python程序,会使用名为全局解释器锁GIL(Global Interpreter Lock)的全局锁。这意味着在同一时刻只有一个线程会执行Python代码。(如果多个线程尝试访问同一个对象数据,那么它可能处于不一致的状态)

故此,python中的并行编程想要发挥多核的优势推荐使用多进程代替多线程

为什么不去除GIL? 更多细节:Python 最难的问题


python中进程与线程的效率

由于python自身存在GIL的问题,同一时刻只能运行一个线程,在一些实验对比中,我们会发现python中进程与线程之间的差异,在这里直接给出结论
对比操作:CPU密集型IO密集型网络请求密集型

多线程

  • CPU密集型操作,性能更差
  • IO密集型操作,性能更差
  • 网络请求密集型操作,优势明显

多进程

  • CPU密集型操作,优势明显
  • IO密集型操作,优势明显
  • 网络请求密集型操作,与多线程相差无几,却更占用CPU等资源

故CPU密集型、IO密集型操作,首选多进程,网络请求密集型选择多线程

(附:如果追求效率,CPU密集型操作应首选C/C++语言
IO密集型操作,CPU消耗很少,换用C/C++也很难得到效率的提升,应采用开发效率高的语言,脚本语言是首选)

更多细节:Python中单线程、多线程和多进程的效率对比实验


1.参考书籍: 《Python并行编程手册》

2.NP完全问题: NP完全问题是世界七大数学难题之一。所有的完全多项式非确定性问题,都可以转换为一类叫做满足性问题的逻辑运算问题。既然这类问题的所有可能答案,都可以在多项式时间内计算,人们于是就猜想,是否这类问题存在一个确定性算法,可以在多项式时间内直接算出或是搜寻出正确的答案呢?这就是著名的NP=P?的猜想(百度百科)
https://zh.wikipedia.org/wiki/NP%E5%AE%8C%E5%85%A8(wiki百科

3.多线程和多进程的区别: 参考:追溯到最早的一篇2011年的页面已失效了

标签:python,简介,并行,任务,线程,进程,密集型,多线程,CPU
来源: https://www.cnblogs.com/maplesnow/p/12044357.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有