Python - 并发简介
在本章中,我们将了解 Python 中的并发概念,并了解不同的线程和进程。
什么是并发性?
简而言之,并发是指两个或多个事件同时发生。并发是一种自然现象,因为许多事件在任何给定时间同时发生。
在编程方面,并发是指两个任务在执行中重叠。通过并发编程,我们的应用程序和软件系统的性能可以得到提高,因为我们可以同时处理请求,而不是等待前一个请求完成。
并发历史回顾
以下几点将为我们简要回顾并发性的历史 -
从铁路的概念出发
并发性与铁路的概念密切相关。对于铁路,需要在同一铁路系统上处理多列火车,以便每列火车都能安全到达目的地。
学术界的并发计算对计算机科学并发的兴趣始于 Edsger W. Dijkstra 于 1965 年发表的研究论文。在本文中,他确定并解决了互斥问题,即并发控制的特性。
高级并发基元
最近,由于引入了高级并发原语,程序员正在获得改进的并发解决方案。
改进了与编程语言的并发性
Google 的 Golang、Rust 和 Python 等编程语言在帮助我们获得更好的并发解决方案的领域取得了令人难以置信的发展。
什么是线程和多线程?
线程 是可以在操作系统中执行的最小执行单位。它本身不是一个程序,而是在程序中运行。换句话说,线程不是彼此独立的。每个线程与其他线程共享代码段、数据段等。它们也称为轻量级进程。
线程由以下组件组成 -
- 程序计数器,由下一条可执行指令的地址组成
- 堆栈
- 寄存器集
- 唯一 ID
另一方面,多线程是 CPU 通过并发执行多个线程来管理操作系统使用的能力。多线程的主要思想是通过将一个进程划分为多个线程来实现并行性。借助以下示例可以理解多线程的概念。
例假设我们正在运行一个特定的进程,在该进程中打开 MS Word 以在其中键入内容。将分配一个线程来打开 MS Word,另一个线程将需要在其中键入内容。现在,如果我们想编辑现有的,那么将需要另一个线程来执行编辑任务,依此类推。
什么是过程和多进程?
流程定义为一个实体,它表示要在系统中实现的基本工作单元。简单来说,我们将计算机程序编写在一个文本文件中,当我们执行这个程序时,它就变成了一个执行程序中提到的所有任务的进程。在流程生命周期中,它会经历不同的阶段 – Start、Ready、Running、Waiting 和 Terminating。
下图显示了流程的不同阶段 -
一个进程只能有一个线程(称为主线程),也可以有多个线程具有自己的寄存器、程序计数器和堆栈集。下图将向我们展示差异 -
另一方面,多处理是在单个计算机系统中使用两个或多个 CPU 单元。我们的主要目标是充分发挥我们的硬件潜力。为此,我们需要利用计算机系统中可用的全部 CPU 内核。多处理是实现此目的的最佳方法。
Python 是最流行的编程语言之一。以下是使其适合并发应用程序的一些原因 -
语法糖
语法糖是编程语言中的语法,旨在使内容更易于阅读或表达。它使语言对人类使用来说“更甜蜜”:事物可以更清晰、更简洁地表达,或者根据喜好以另一种风格表达。Python 附带了 Magic 方法,可以定义这些方法以作用于对象。这些 Magic 方法被用作语法糖,并绑定到更容易理解的关键词。
大型社区
Python 语言在数据科学家和数学家中得到了广泛的采用,他们在 AI、机器学习、深度学习和定量分析领域工作。
用于并发编程的有用 API
Python 2 和 3 有大量专用于并行/并发编程的 API。其中最流行的是 threading、concurrent.features、multiprocessing、asyncio、gevent 和 greenlet 等。
Python 实现并发应用程序方面的限制
Python 对并发应用程序有限制。此限制称为 GIL(全局解释器锁)存在于 Python 中。GIL 从不允许我们使用 CPU 的多个内核,因此我们可以说 Python 中没有真正的线程。我们可以将 GIL 的概念理解为以下 -
GIL (全局解释器锁)
这是 Python 世界中最具争议的话题之一。在 CPython 中,GIL 是互斥锁 - 互斥锁,它使事情变得线程安全。换句话说,我们可以说 GIL 阻止了多个线程并行执行 Python 代码。锁一次只能由一个线程持有,如果我们想执行一个线程,那么它必须先获取锁。下图将帮助您了解 GIL 的工作原理。
但是,Python 中有一些库和实现,例如 Numpy、Jpython 和 IronPytbhon。这些库无需与 GIL 进行任何交互即可工作。