并发编程解决的问题大体上可以分为“速度”和“设计可管理性”两种。

一、更快地执行

并发是用于多处理器编程的基本工具。速度提高是以多核处理器的形式而不是更快的芯片的形式出现。为了使程序运行得更快,必须学习如何利用额外的处理器,这正是并发赋予的能力。

多处理器的Web服务器,在为每个请求分配一个线程的程序中,它可以将大量的用户请求分不到多个CPU上。

并发通常是提高运行在单处理器上的程序的性能。听起来可能会有些违背直觉。如果仔细考虑会发现,在单处理器上运行的并发程序确实应该比该程序所有部分都顺序执行的开销大,因为其中增加了所谓上下文切换的代价(从一个任务切换到另一个任务)。表面上看,将程序的所有部分当作单个的任务运行好像是开销更小一些,并且可以节省上下文切换的代价。

使得上述问题变的不同的是阻塞。如果程序中的某个任务因为该程序控制范围之外的某些条件而导致不能继续执行,可以说这个任务或线程阻塞了。如果没有并发,那整个程序都将停止下来,直至外部条件发生变化。但是,如果使用并发来编写程序,那么当一个任务阻塞时,程序中的其他任务还可以继续执行。

从性能的角度出发,如果没有任务会阻塞,那么在单处理器机器上使用并发就没有任何意义。

在单处理器系统中的性能提高的常见示例是事件驱动的编程。实际上,使用并发最吸引人的一个原因就是要产生具有可响应的用户界面。考虑一个程序,它因为将执行某些长期运行的操作,所以最终用户输入会被忽略,从而成为不可响应的程序。通过创建单独的线程来响应用户的输入,即使这个线程在大多数的时间里都是阻塞的,但是程序可以保证具有一定成度的可响应性。

实现并发最直接的方式是在操作系统级别使用进程。进程是运行在它自己的地址空间内的自包容的程序。多任务操作系统可以通过周期性地将CPU从一个进程切换到另一个进程,来实现同时运行多个进程,尽管这使得每个进程看起来在其执行过程中都是停停歇歇的。

因为操作系统通常会将进程相互隔离开,因此它们不会彼此干涉,这使得用进程编程相对容易些。与此相反的是,像Java所使用的这种并发系统会共享诸如内存和IO这样的资源,因此编写多线程程序最基本的困难在协调不同线程驱动的任务之间对这些资源的使用,以使得这些资源不会同时被多个任务访问。

对于进程来说,它们之间没有任何彼此沟通的需要,因为它们都是完全独立的。有些人提倡,将进程作为唯一合理的并发方式,但遗憾的是,对进程通常会有数量和开销的限制,以避免它们在不同的并发系统之间的可应用性。

某些编程语言被设计为可以将并发任务彼此隔离,这些语言通常被称为函数型语言。其中,每个函数调用都不会产生任何副作用,并因此而不能干涉其他函数,并因此可以当作独立的任务来驱动。Erlang就是这样的语言,它包含针对任务之间彼此通信的安全机制。

Java采取了更加传统的方式,在顺序型语言的基础上提供对线程的支持

在与多任务操作系统中分叉外部进程不同,线程机制是在由执行程序表示的单一进程中创建任务。这种方式产生的一个好处是操作系统的透明性。

二、改进代码设计

在单CPU的机器上使用多任务的程序在任意时刻仍旧只在执行一项工作,因此从理论上讲,肯定可以不用任何任务而编写出相同的程序。但是,并发提供了一个重要的组织结构上的好处:程序设计可以极大地简化。

多线程系统对可用的线程数量的限制通常都会是一个相对较小的数字,又是就是数十或数百这样的数量级。这个数字的变化可能依赖于平台,或者依赖于Java版本。在Java中,通常要假定你不会获得足够的线程,从而使得可以为大型仿真中的每个元素提供一个线程???

Java的线程机制是抢占式的,这表示调度机制会周期性地中断线程,将上下文切换到另一个线程,从而为每个线程都提供时间片,使得每个线程都会分配到数量合理的时间去驱动它的任务。

协作多线程。在协作式系统中,每个任务都会自动地放弃控制,这要求程序猿要有意识地在每个任务中插入某种类型的让步语句。协作式系统的优势是双重的:上下文切换的开销通常比抢占式系统要低廉许多,并且对可以同时执行的线程数量在理论上没有任何限制。

并发需要付出代价,包含复杂性代价,但是这些代价与在程序设计、资源负载均衡以及用户方便使用方面的改进相比,就显得微不足道了。通常,线程使你能够创建更加松散耦合的设计,否则,你的代码中各个部分都必须显式地关注那些通常可以由线程来处理的任务。

相关链接

The Art of Unix Programming (catb.org)

被时间“埋没”的高并发王者:Erlang - 知乎 (zhihu.com)

Index - Erlang/OTP

OB tags

#Java #并发 #多线程 #Thinking-in-Java