【Linux】管道容量及缓冲区的存储方式

时间:2024-03-31 11:04:02

1.管道容量

管道容量分为 pipi capacitypipe_buf,这两者的区别在于 pipe_buf  定义的是内核管道缓冲区的大小,这个值的大小是由内核设定的,这个值仅需一条命令就可以查到,而 pipe capacity  指的是管道的最大值,即容量,是内核内存中的一个缓冲区。


pipe_buf  命令:ulimit -a


【Linux】管道容量及缓冲区的存储方式


管道容量:sizeof(pipe_buf)= 512 bytes * 8 = 4kb


pipi capacity:

当管道满的时候 O_NONBLOCK disable: write 调用阻塞,直到有进程读走数据

            O_NONBLOCK enable:调用返回 -1,errno 值为 EAGAIN

pipi capacity 的大小需要写一段程序去检测,代码如下所示:


【Linux】管道容量及缓冲区的存储方式


【Linux】管道容量及缓冲区的存储方式


【Linux】管道容量及缓冲区的存储方式


运行结果如下:

【Linux】管道容量及缓冲区的存储方式


可以看出 pipe capacity 的大小为 65536。




2. 管道缓冲区

1)管道(pipe

管道是进程间通信的主要手段之一。一个管道实际上就是个只存在于内存中的文件,对这个文件的操作要通过两个已经打开文件进行,它们分别代表管道的两端。

管道是一种特殊的文件,它不属于某一种文件系统,而是一种独立的文件系统,有其自己的数据结构。根据管道的适用范围将其分为:无名管道和命名管道。

(1)无名管道

主要用于父进程与子进程之间,或者两个兄弟进程之间。在 Linux 系统中可以通过系统调用建立起一个单向的通信管道,且这种关系只能由父进程来建立。因此,每个管道都是单向的,当需要双向通信时就需要建立起两个管道。管道两端的进程均将该管道看做一个文件,一个进程负责往管道中写内容,而另一个从管道中读取,这种传输遵循“先入先出”(FIFO)的规则。

(2)命名管道

  命名管道是为了解决无名管道只能用于近亲进程之间通信的缺陷而设计的。命名管道是建立在实际的磁盘介质或文件系统(而不是只存在于内存中)上有自己名字的文件,任何进程可以在任何时间通过文件名或路径名与该文件建立联系。为了实现命名管道,引入了一种新的文件类型—— FIFO 文件(遵循先进先出的原则)。实现一个命名管道实际上就是实现一个 FIFO 文件。命名管道一旦建立,之后它的读、写以及关闭操作都与普通管道完全相同。虽然 FIFO 文件的 inode 节点在磁盘上,但是仅是一个节点而已,文件的数据还是存在于内存缓冲页面中,和普通管道相同。

管道通讯如下图:

【Linux】管道容量及缓冲区的存储方式

管道通讯带来的问题:管道容量不像其他文件一样不加检索的增长。

1.使用单个固定缓冲区也会带来问题,比如在写管道时可能变满,当这种情况发生时,随后对管道的 write()  调用将默认地被阻塞,等待某些数据被读取,以便腾出足够的空间供 write() 调用写。

2.读取进程也可能工作得比写进程快。当所有当前进程数据已被读取时,管道变空。当这种情况发生时,一个随后的 read() 调用将默认地被阻塞,等待某些数据被写入,这解决了 read() 调用返回文件结束的问题。

注意:从管道读数据是一次性操作,数据一旦被读,它就从管道中被抛弃,释放空间以便写更多的数据。

管道的结构:在 Linux 中,管道的实现并没有使用专门的数据结构,而是借助了文件系统的 file构和 VFS 的索引节点 inode。通过将两个  file 结构指向同一个临时的 VFS 索引节点,而这 VFS 索引节点又指向一个物理页面而实现的。如下图所示:

【Linux】管道容量及缓冲区的存储方式

两个 file 数据结构,但它们定义文件操作例程地址是不同的,其中一个是向管道中写入数据的例程地址,而另一个是从管道中读出数据的例程地址。这样,用户程序的系统调用仍然是通常的文件操作,而内核却利用这种抽象机制实现了管道这一特殊操作。一个普通的管道仅可供具有共同祖先的两个进程之间共享,并且这个祖先必须已经建立了供它们使用的管道。注意,在管道中的数据始终以和写数据相同的次序来进行读,这表示 lseek() 系统调用对管道不起作用。