图片 13

线程与进程–线程

本文主要参考自孙钟秀主编的《操作系统教程》一书中关于进程和线程的部分。

在传统的操作系统中,进程是系统进行资源分配的单位,由于并行技术、网络技术、并发程序设计效率的反正,引入了多线程机制;

进程

为什么引入进程?

一,刻画系统动态性,发挥系统并发性,提高资源利用率。

以C#为例,在编辑器Visual Studio
Code写了几行代码,保存为cs文件。在未运行状态的下的代码,称之为静态的程序。静态的程序是一个相对的概念。当程序运行起来,它的运行依赖于处理器(CPU)和主存储器资源,我可以称之为动态的程序。以该程序动态执行的过程为基本单位,抽象出一个概念,进程,即进行中的程序。

进程二字,主要是强调动态性。处理器调动进程,存储器为进程分配进程空间,为处理器分配调动控制进程的空间,进程因此创建。当资源不足,或者需等待某个事件发生,进程暂停执行。乃至最后进程运行结果,程序退出主存储器,进程消亡。进程的出现到消亡,无疑是在不断地动态变化。

二,解决共享性。

当你完成一个公用函数时,该函数可以被多个程序调用。
图片 1

函数A在被程序甲调用,程序甲正在等待写入磁盘数据操作的返回,处理器空闲,为提高处理器利用效率,程序乙于此同时开始执行,进入起始点a。

此时,如何描述函数A?A处于等待点?A处于起始点a?试着引入进程的概念,将函数和程序联系起来,A对于程序甲构成进程A,A对于程序乙构成进程A。进程A处于等待点,进程A处于起始点。

进程(process)这个名词最早是1960年在MIT的MULTICS和IBM公司的
TSS/360系统中提出的,直到目前对进程的定义和名称均不统一,不同的系统中采用不同的术语名称,例如,MIT称进程(process),IBM公司称任务(task)和
Univac公司称活动(active)。可以说进程的定义多种多样,国内学术界较为一致的看法是:进程是一个可并发执行的具有独立功能的程序关于某个数据集合的一次执行过程,也是操作系统进行资源分配和保护的基本单位(1978
年全国操作系统学术会议)

进程属性:

  1. 结构性。进程至少有三要素组成:程序块、数据块、进程控制块。
  2. 共享性。多个进程可共享相同的程序。
  3. 动态性。进程是动态的概念,有生命周期。程序作为一组有序指令的序列合集,是静态概念,程序可以作为一种系统资源永远存在。
  4. 独立性。进程既是系统中资源分配和保护的基本单位,也是系统调度的独立单位(单线程进程)。凡是未建立进程的程序,都不能作为独立单位参与运行。通常,每个进程都可以各自独立的速度在
    CPU上推进。
  5. 制约性:并发进程之间存在着制约关系,进程在进行的关键点上需要相互等待或互通消息,以保证程序执行的可再现性和计算结果的惟一性。
  6. 并发性:进程可以并发地执行,进程的并发性能改进资源利用率和提高系统效率。

1、多线程环境下的进程与线程

线程

随着并行技术、网络技术和软件设计技术的发展,给并发程序设计效率带来了一系列新的问题,主要表现在:

  • 进程时空的开销大,频繁的进程调度将耗费大量处理器时间,要为每个进程分配存储空间限制了操作系统中进程的总数。
  • 进程通信的代价大,每次通信均要涉及通信进程之间或通信进程与操作系统之间的信息传递。
  • 进程之间的并发性粒度较粗,并发度不高,过多的进程切换和通信延迟使得细粒度的并发得不偿失。
  • 不适合并行计算和分布并行计算的要求,对于多处理器和分布式的计算环境来说,进程之间大量频繁的通信和切换,会大大降低并行度。
  • 不适合客户!服务器计算的要求。对于
    C/S结构来说,那些需要频繁输入输出并同时大量计算的服务器进程(如数据库服务器、事务监督程序)很难体现效率。

如果说操作系统中引入进程的目的是为了使多个程序能并发执行,以改善资源使用率和提高系统效率,那么,在操作系统中再引入线程,则是为了减少程序并发执行时所付出的时空开销,使得并发粒度更细、并发性更好。

进程可以分为两项功能:一是独立分配资源,二是被调度分派执行。分配资源仍由进程实现,无需频繁切换。抽出线程的概念,将被调度分派执行的任务移交给线程,可以被频繁的调度和切换。

1、多线程下的进程

在单线程进程模型中,进程和线程的概念可以不加区别,它是由进程控制块和用户地址空间,以及系统/用户堆栈等组成。在进程运行时,处理器的寄存器由进程控制,而进程不运行时,这些寄存器的内容会被保护,所进程与进程之间的关系比较疏远,相对独立,进程管理的开销大,进程间通信效率低微。

图片 2

image.png

使用单线程进程进行并发程序设计称为并发多进程程序设计,采用此种方式时,并发进程之间的切换和通信均要借助进程管理和进程通信机制,因而实现代价较大,进一步影响了并发的粒度。

为解决这一问题,我们将一个进程的运行划分为两个部分:对资源的管理者和实际的指令执行序列

图片 3

image.png

如果把进程的管理和执行相分离,进程是操作系统中进行保护和资源分配的单位,允许一个进程中包含由多个可并发执行的控制流,这些控制流的切换时,不需要通过进程调度,通信时可以借助共享内存区,这就是并发多线程序设计

图片 4

image.png

在多线程环境中,仍然有与进程相关的是PCB
和用户地址空间,而每个线程则存在独立堆栈,以及包含寄存器信息、优先级、其它有关状态信息的线程控制块。线程之间的关系较为密切,一个进程中的所有线程共享其拥有的状态和资源。它们驻留在相同的地址空间,可以存取相同的数据。例如,当一个线程改变了主存中一个数据项时,如果这时其它线程也存取这个数据项,它便能看到相同的结果。

图片 5

image.png

进程和线程的相对概念

单线程(结构)进程(single threaded
process):进程在任一时刻只有一个执行控制流
在单线程(结构)进程(single threaded
process)中,进程和线程的概念可以不加区分。

图片 6

多线程(结构)进程(multiple threaded process):

  • 在同一进程中设计出多条控制流;
  • 多控制流之间可以并行执行;
  • 多控制流切换不需通过进程调度;
  • 多控制流之间还可以通过内存区直接通信,降低通信开销

图片 7

多线程环境中进程的定义:进程是操作系统中进行保护和资源分配的基本单位。
它具有:

  • 一个虚拟地址空间,用来容纳进程的映像;
  • 对处理器、其他(通信的)进程、文件和 I/O资源等的有控制有保护的访问。

而传统进程原先所承担的控制流执行任务交给称作线程的部分完成。

多线程环境中的线程概念:线程是操作系统进程中能够独立执行的实体(控制流),是处理器调度和分派的基本单位。线程是进程的组成部分,每个进程内允许包含多个并发执行的实体(控制流),这就是多线程。同一个进程中的所有线程共享进程获得的主存空间和资源,但不拥有资源。

线程具有:

  • 线程执行状态(运行、就绪、等待⋯⋯)。
  • 当线程不运行时,有一个受保护的线程上下文,用于存储现场信息。所以,观察线程的一种方式是运行在进程内一个独立的程序计数器。
  • 一个执行堆栈。
  • 一个容纳局部变量的主存存储区。

线程属性:

  1. 并发性:同一进程的多个线程可在一个或多个处理器上并发或并行地执行,而进程之间的并发执行演变为不同进程的线程之间的并发执行。
  2. 共享性:同一个进程中的所有线程共享但不拥有进程的状态和资源,且驻留在进程的同一个主存地址空间中,可以访问相同的数据。所以,需要有线程之间的通信和同步机制。通信和同步的实现十分方便。
  3. 动态性:线程是程序在相应数据集上的一次执行过程,由创建而产生,至撤销而消亡,有其生命周期,经历各种状态的变化。每个进程被创建时,至少同时为其创建一个线程,需要时线程可以再创建其他线程。
  4. 结构性:线程是操作系统中的基本调度和分派单位,因此,它具有惟一的标识符和线程控制块,其中应包含调度所需的一切私有信息。

进程可以划分为两个部分:资源集合和线程集合。进程要支撑线程运行,为线程提供地址空间和各种资源,它封装了管理信息,包括对指令代码、全局数据和
I/O状态数据等共享部分的管理。线程封装了执行信息,包括对CPU寄存器、执行栈(用户栈、内核栈)和局部变量、过程调用参数、返回值等线程私有部分的管理。由于线程具有许多传统进程所具有的特征,所以也把线程称为轻量进程
LWP(Light-Weight Process)。

图片 8

2、多线程环境下的线程概念

线程则是指进程过程中的一条执行路径(控制流),每个进程内允许包含多个并行执行的路径,这就是多线程。多线程时系统进行处理器调度的基本单位,同一个进程下的所有线程共享进程获得的主内存空间和资源。线程具体:

  • 一个线程执行状态(就绪、运行。。。)
  • 有一个受保护的线程上下文,当线程不执行时,用于存储现场信息
  • 一个独立的程序指令计数器
  • 一个执行堆栈
  • 一个容纳局部变量的静态存储器
  • 无挂起
    其含义以下特性:
  • 并行性:同一个进程的多线程可以在一个或多个处理器上并发或并行的运行
  • 共享性:同一个进程中的所有线程共享进程获得主存空间和一切资源
  • 动态性:线程也是程序在相应数据集上的一个执行,由创建而产生,至撤销而消亡,由生命周期

图片 9

image.png

空间是完成一个程序的运行所需占有和管理的内存空间,它封装了对进程的管理,包括对指令代码、全局数据和
I/O 状态数据等共享部分的管理。线程封装了并发(concurrency),包括对 CPU
寄存器、执行栈(用户栈、内核栈)和局部变量、过程调用参数、返回值等线程私有部分的管理。线程主动地访问空间。

3、线程的状态

于进程相似,线程也有一个生命周期,因而也存在各种状态。从理论上来说,线程的关键状态由:运行、就绪、和阻塞。其状态变换类似于进程

2、线程的实现

从实现的角度,线程分为两种,用户级线程(ULT 如Java),内核级线程(KLT
如OS/2)。后者可归结为内核支撑线程或轻量进程。还有一些为混合式线程;

图片 10

image.png

1、内核级线程 KLT

在纯内核级线程设施中,线程管理的所有工作由操作系统OS内核来完成。KLT专门提供一个API,以供调用,应用区不需要有线程管理的代码,而是由内核调度KLT。

图片 11

image.png

2、用户级线程 ULT

纯 ULT
设施中,线程管理的全部工作都由应用程序来做,内核是不知道线程的存在的。用户级多线程由线程库来实现,任何应用程序均需通过线程库进行程序设计,再与线程库连接后运行来实现多线程。线程库是一个
ULT
管理的例行程序包,它包含了建立/毁灭线程的代码、在线程间传送消息和数据的代码、调度线程执行的代码、以及保护和恢复线程状态(contexts)的代码。

图片 12

image.png

Jacketing 技术
为了解决用户级线程的缺点,使用一种称作jacketing的技术。主要思想是把阻塞式的系统调用改造成非阻塞式的,当线程调用系统调用,首先调用
jacketing 实用程序,由jacketing
程序来检查资源使用情况,以决定是否调用系统调用或传递控制权给另一个线程;

图片 13

image.png