学习笔记——操作系统_PV操作与Linux内核信号量

时间:2022-05-27 15:17:49

这篇文章参考了如下内容:

http://wenku.baidu.com/view/42a5704ccf84b9d528ea7ac0.html

http://wenku.baidu.com/view/71d778fafab069dc502201bc.html

http://zhwen.org/xlog/?p=165

http://blog.chinaunix.net/uid-21273878-id-1828718.html

http://blog.csdn.net/leves1989/article/details/3305609(详细介绍了PV操作)

PV操作

首先应弄清PV操作的含义

PV操作由P操作原语和V操作原语组成(原语是不可中断的过程),对信号量进行操作,具体定义如下:
    P(S):

①将信号量S的值减1,即S=S-1;// 系统获得资源后的资源数目
②如果S>=0,表示系统中有资源存在,则该进程继续执行;否则该进程置为等待状态,排入等待队列。注意这儿是大于等于0,因为先进行了减1操作;
    V(S):

①将信号量S的值加1,即S=S+1;// 当前进程释放了一个资源
②如果S>0,则该进程继续执行;否则表示有其他进程在等待该资源,需要释放等待队列中等待信号量的进程,同时该进程继续执行。

【说明】这儿是大于0,说明现在系统中起码有一个资源,这儿为什么不执行一下调度程序,而是在资源S小于等于0调度呢?

因为在资源释放后大于0,说明系统中没有其他进程在等待该资源,则进程是没有权利进行调度的。

如果进程释放资源后,仍然是小于等于0,说明有多个进程在等待资源,这个时候就执行调度。

PV操作的意义:我们用信号量及PV操作来实现进程的同步和互斥。

PV操作属于进程的低级通信。

  • 对于互斥操作——M个进程访问N个资源,且M>N,则需要进行互斥操作,即让有些进程进入等待队列,解决死锁问题;互斥的时候,只要设置一个信号量,赋于初值;
  • 对于同步操作——A进程生产出东西给B进程用,A和B进程之间就要同步一下;同步的时候需要设置两个信号量在A和B之间同步处理

信号量(semaphore)的数据结构为一个值和一个指针,指针指向等待该信号量的下一个进程。信号量的值与相应资源的使用情况有关。

当它的值大于0时,表示当前可用资源的数量;

当它的值小于0时,其绝对值表示等待使用该资源的进程个数。注意,信号量的值仅能由PV操作来改变。
 
一般来说,信号量S表示可用资源的数量。执行一次P操作意味着请求分配一个单位资源,因此S的值减1;当S<=0时,表示已经没有可用资源,请求者必须等待别的进程释放该类资源,它才能运行下去。而执行一个V操作意味着释放一个单位资源,因此S的值加1;若S<=0,表示有某些进程正在等待该资源,因此要唤醒一个等待状态的进程,使之运行下去。

利用信号量和PV操作实现进程互斥的一般模型是:
进程P1              进程P2           ……          进程Pn
……                  ……                           ……
P(S);              P(S);                         P(S);
临界区;             临界区;                        临界区;
V(S);              V(S);                        V(S);
……                  ……            ……           ……

    其中信号量S用于互斥,初值为1。
    使用PV操作实现进程互斥时应该注意的是:
    (1)每个程序中用户实现互斥的P、V操作必须成对出现,先做P操作,进临界区,后做V操作,出临界区。若有多个分支,要认真检查其成对性。
    (2)P、V操作应分别紧靠临界区的头尾部,临界区的代码应尽可能短,不能有死循环。
   (3)互斥信号量的初值一般为1。

 【例1】生产者-消费者问题

在多道程序环境下,进程同步是一个十分重要又令人感兴趣的问题,而生产者-消费者问题是其中一个有代表性的进程同步问题。下面我们给出了各种情况下的生产者-消费者问题,深入地分析和透彻地理解这个例子,对于全面解决操作系统内的同步、互斥问题将有很大帮助。

(1)一个生产者,一个消费者,公用一个缓冲区。
定义两个同步信号量:
empty——表示缓冲区是否为空,初值为1。
   full——表示缓冲区中是否为满,初值为0。
生产者进程

while(TRUE){
	生产一个产品;
     P(empty);
     产品送往Buffer;
     V(full);
}
消费者进程
while(True){
	P(full);
   	从Buffer取出一个产品;
   	V(empty);
   	消费该产品;
   }
(2)一个生产者,一个消费者,公用n个环形缓冲区。
定义两个同步信号量:
empty——表示缓冲区是否为空,初值为n。
full——表示缓冲区中是否为满,初值为0。

设缓冲区的编号为1~n-1,定义两个指针in和out,分别是生产者进程和消费者进程使用的指针,指向下一个可用的缓冲区。
生产者进程

while(TRUE){
     生产一个产品;
     P(empty);
     产品送往buffer(in);
     in=(in+1)mod n;
     V(full);
}
消费者进程
while(TRUE){
 P(full);
   从buffer(out)中取出产品;
   out=(out+1)mod n;
   V(empty);
   消费该产品;
   }

(3)一组生产者,一组消费者,公用n个环形缓冲区

    在这个问题中,不仅生产者与消费者之间要同步,而且各个生产者之间、各个消费者之间还必须互斥地访问缓冲区。
定义四个信号量:
empty——表示缓冲区是否为空,初值为n。
full——表示缓冲区中是否为满,初值为0。
mutex1——生产者之间的互斥信号量,初值为1。
mutex2——消费者之间的互斥信号量,初值为1。

    设缓冲区的编号为1~n-1,定义两个指针in和out,分别是生产者进程和消费者进程使用的指针,指向下一个可用的缓冲区。
生产者进程

while(TRUE){
     生产一个产品;
     P(empty);
     P(mutex1);
     产品送往buffer(in);
     in=(in+1)mod n;
     V(mutex1);
     V(full);
}
消费者进程
while(TRUE){
 P(full)
   P(mutex2);
   从buffer(out)中取出产品;
   out=(out+1)mod n;
   V(mutex2);
   V(empty);
   消费该产品;
   }

  需要注意的是无论在生产者进程中还是在消费者进程中,两个P操作的次序不能颠倒。应先执行同步信号量的P操作,然后再执行互斥信号量的P操作,否则可能造成进程死锁。

【说明】为什么要先执行同步信号量P,再执行互斥信号量P呢?


【例2】桌上有一空盘,允许存放一只水果。爸爸可向盘中放苹果,也可向盘中放桔子,儿子专等吃盘中的桔子,女儿专等吃盘中的苹果。规定当盘空时一次只能放一只水果供吃者取用,请用P、V原语实现爸爸、儿子、女儿三个并发进程的同步。

分析 在本题中,爸爸、儿子、女儿共用一个盘子,盘中一次只能放一个水果。当盘子为空时,爸爸可将一个水果放入果盘中。若放入果盘中的是桔子,则允许儿子吃,女儿必须等待;若放入果盘中的是苹果,则允许女儿吃,儿子必须等待。本题实际上是生产者-消费者问题的一种变形。这里,生产者放入缓冲区的产品有两类,消费者也有两类,每类消费者只消费其中固定的一类产品。

    :在本题中,应设置三个信号量S、So、Sa,信号量S表示盘子是否为空,其初值为l;信号量So表示盘中是否有桔子,其初值为0;信号量Sa表示盘中是否有苹果,其初值为0。同步描述如下:

int S=1;
int Sa=0;
int So=0;
      main()
      {
        cobegin
            father();      /*父亲进程*/
            son();        /*儿子进程*/
            daughter();    /*女儿进程*/
        coend
    }
    father()
    {
        while(1)
          {
            P(S);
            将水果放入盘中;
            if(放入的是桔子)V(So);
            else  V(Sa);
           }
     }
    son()
    {
        while(1)
          {
             P(So);
             从盘中取出桔子;
             V(S);
             吃桔子;
            }
    }
    daughter()
    {
         while(1)
            {
              P(Sa);
              从盘中取出苹果;
              V(S);
              吃苹果;
            }
}


  【例3】 桌上有一空盘,允许存放2只水果。爸爸可向盘中放苹果,妈妈可向盘中放桔子,儿子专等吃盘中的桔子,女儿专等吃盘中的苹果,请用P、V原语实现爸爸、妈妈、儿子、女儿三个并发进程的同步。

这是一个同步问题,果盘不存在互斥操作,对于同步,需要至少2个信号量处理,这道题目


同步历程如下:

long S = 2;
long So = 0;
long Sa = 0;

void main
{
cobegin
	father();
	mather();
	son();
	daughter();
coend
}

father()
{
	while(1)
	{
		P(S)
		放苹果
		V(Sa)
	}
}

mather()
{
	while(1)
	{
		P(S)
		放桔子
		V(So)
	}
}

son()
{
	while(1)
	{
		P(So)
		吃桔子
		V(S)
	}
}

daughter()
{
	while(1)
	{
		P(Sa)
		吃苹果
		V(S)
	}
}

继续上面的这个例子:

如果对水果盘设置互斥信号,即某个时刻只允许一个人访问水果盘,则系统中需要添加互斥访问变量mutex,初值设置为1,这个时候的例程修改为:

 

什么是信号量

信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。

信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠队列中,等待被唤醒。

信号量的分类

Linux提供三种信号量:

(1)      内核信号量,由内核控制路径使用

(2)      用户态进程使用的信号量,这种信号量又分为POSIX信号量和SYSTEM V信号量。

内核信号量

为了同步对内核共享资源的访问,内核提供了down 函数和up 函数用于获取和释放资源。down 和up 所保护的访问资源的内核代码区域,就构成一个临界区。在等待获取资源进入临界区的过程中,代表进程运行的内核控制路径可以睡眠。

因此,简单理解:系统利用down和up实现了教科书中的PV操作。

内核信号量类似于自旋锁,因为当锁关闭着时,它不允许内核控制路径继续进行。然而,当内核控制路径试图获取内核信号量锁保护的忙资源时,相应的进程就被挂起。只有在资源被释放时,进程才再次变为可运行。 只有可以睡眠的函数才能获取内核信号量;中断处理程序和可延迟函数都不能使用内核信号量。为什么呢?因为内核信号量是这么定义的:

struct semaphore {
   atomic_t 			count;	// 资源计数
   int 				sleepers;	// 表示是否有进程在信号量上睡眠(两个地方描述不一致,有的没有这个变量)
   wait_queue_head_t 	wait;		// 当前等待睡眠的队列头指针
  }


我在另外一份网页上看到semaphore的定义是这样的:

定义信号量:下面代码定义名为sem的信号量。

struct semaphore sem;

struct semaohore结构体在内核中定义如下,/include/linux/semaphore.h目录下:

struct semaphore{
       spinlock_t              lock;			//	为什么要自旋锁呢?因为对信号量的操作离不开锁装置;
       unsigned int           count;		// 	记录当前进程在信号量上的睡眠个数
       struct list_head       wait_list;	//	睡眠队列
};

内核信号量可以理解为是一种睡眠锁!

内核信号量的操作

  • 当进程需要获取信号量时,它调用down函数进入临界区。down将semphore的count字段减1,若count非负,则可进入临界区;否则,加入睡眠队列。
  • 当进程离开临界区时,它调用up函数。up将semphore的count字段加1,若count非正,表示有进程睡眠,则将进程从wait等待队列中移走并唤醒它。

说明:当up唤醒等待队列中睡眠进程时,是唤醒所有等待进程,还是只唤醒一个?如果唤醒所有进程,它们醒来后,就会去竞争一个获得信号量的机会,竞争失败的进程只能再度睡眠,这就使得系统有许多无谓的schedule切换,降低了系统性能。所以,up只唤醒一个进程。为了保持FIFO的唤醒顺序,down会将新进程以独占方式(表示唤醒时只唤醒一个)加在等待队列尾部,up则去唤醒等待队列头部的第一个独占进程。


内核信号量的PV操作


初始化信号量

在/include/linux/semaphore.h目录下,

void sema_init(struct semaphore* sem, int val) 

函数用于初始化信号量并设置信号量sem的值为val。尽管信号量可以被初始化为大于1的值从而成为一个计数信号量,但是它通常不被这样使用。

内核定义了两个宏来把sem的值设置为1或者0。

#define init_MUTEX(sem)                  		sema_init(sem, 1)
#define init_MUTEX_LOCKED(sem)         	 sema_init(sem, 0)

使用init_MUTEX(sem) 初始化信号量时,表示信号量最初是可以被获取的。

而使用init_MUTEX_LOCKED(sem) 初始化信号量时,此信号量只有先被释放才可以获取。


信号量的P操作——down


获取信号量

void down(struct semaphore *sem);

该函数用于获取信号量sem,它会导致睡眠,因此不能在中断上下文使用。

在内核里该函数的源代码如下:在kernel/semaphore.c文件里:

void down(struct semaphore *sem)
{
unsigned long flags;

spin_lock_irqsave(&sem->lock, flags);

if (likely(sem->count > 0))
	sem->count--;
else
	__down(sem);

spin_unlock_irqrestore(&sem->lock, flags);
}

这里重点看if (likely(sem->count > 0)),这句话表示当获取信号量成功时,就执行sem->count--; 即对信号量的值减一。else表示获取信号量失败,此时调用__down函数进入睡眠状态,并将此进程插入到等待队列尾部。

内核定义了信号量的等待队列结构体:


获取信号量down的另外一种定义方式:

int down_interruptible(struct semaphore *sem);

该函数功能与down()类似,不同之处是,down()在获取信号量失败进入睡眠状态时的进程是不能被打断的,而down_interruptible()在进入睡眠状态时的进程能被信号打断,信号也会导致函数返回。下面我们也来看一看这个函数的源码:在kernel/semaphore.c文件里:

int down_interruptible(struct semaphore *sem)
 {
         unsigned long flags;
        int result = 0;
 
       spin_lock_irqsave(&sem->lock, flags);
         if (likely(sem->count > 0))
                 sem->count--;
         else
                result = __down_interruptible(sem);
        spin_unlock_irqrestore(&sem->lock, flags);
 
        return result;
 }

这里还有一个问题:在获取信号量失败后,为什么down不能被中断,而down_interruptible却可以被中断呢?我们从downdown_interruptible的源代码可以得知,在获取信号量失败后,down函数运行了__down函数,而down_interruptible函数运行了__down_interruptible。

在__down函数里,是把进程的状态设置为TASK_UNINTERRUPTIBLE ,即不可中断状态。

在__down_interruptible里,是把进程的状态设置为TASK_INTERRUPTIBLE ,即可中断状态。这就解释了以上提出的问题。


释放信号量

void up(struct semaphore *sem);

该函数用于释放信号量sem,唤醒等待者。

它的源代码如下:

void up(struct semaphore *sem)
{
         unsigned long flags;

         spin_lock_irqsave(&sem->lock, flags);
        if (likely(list_empty(&sem->wait_list)))
                sem->count++;
         else
                __up(sem);
        spin_unlock_irqrestore(&sem->lock, flags);
}

up函数首先判断等待队列是否为空,如果是空的话,就执行sem->count++;否则,执行__up()函数,释放掉等待队列尾部的信号量。


信号量示例代码

#include <linux/init.h>
#include <linux/module.h>
#include <linux/sched.h>
#include <linux/sem.h>
 
struct semaphore sem1;
struct semaphore sem2;
 
int num[2][5] = {
       {0,2,4,6,8},
       {1,3,5,7,9}
};
int thread_one(void *p);
int thread_two(void *p);
int thread_one(void *p)
{
       int *num = (int *)p;
       int i;
       for(i = 0; i < 5; i++){
              down(&sem1);      //获取信号量1
              printk("%d ", num[i]);
              up(&sem2);    //释放信号量2
       }
       return 0;
}
int thread_two(void *p)
{
       int *num = (int *)p;
       int i;
       for(i = 0; i < 5; i++){
              down(&sem2);             //获取信号量2
              printk("%d ", num[i]);
              up(&sem1);           //释放信号量1
       }
       return 0;
}
static int lan_init(void)
{
       printk("lan is coming\n");
       init_MUTEX(&sem1);  //初始化信号量1, 使信号量1最初可被获取
       init_MUTEX_LOCKED(&sem2);  //初始化信号量2,使信号量2只有被释放后才可被获取
       kernel_thread(thread_one, num[0], CLONE_KERNEL);
       kernel_thread(thread_two, num[1], CLONE_KERNEL);
       return 0;
}
static void lan_exit(void)
{
       printk("\nlan exit\n");
}
module_init(lan_init);
module_exit(lan_exit);