# 10. 怎么什么东西都是fd

## introduction

> 想要深刻理解epoll是怎么工作的, 就必须先对fd有一个深刻的理解
>
> 一个程序是怎么跟文件系统挂钩的, 为什么一个程序能通过一个文件描述符控制文件.

一个进程能通过"描述符"控制IO-stream, 无论你怎么看, 文件, socket, tty 在本质上都是一种IO-stream, 因为我们都可以从这三者里取出byte数组, 因此在操作系统眼里看来你们都是byte数组的提供方, 就都可以用 fd 指代. 那我们今天要解释的问题就是进程是如何通过fd指代到文件的.

## FD是一个指向内核的指针

![](https://2314591241-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MC_ucxnzAClkrgsGdFP%2Fsync%2F22340688949b4bf22ab3e02425645b0453de48ad.png?generation=1605772273997556\&alt=media)

每一个进程都会维护一个table, 里面维护了他要访问的fd, 一个fd既可以通过open / pipe / socket 这样的方式显式的创建出来, 同时可以是从父进程那里继承过来的. 但总之他有一张表, 里面罗列了所有的fd. 我们从上面的图看下一个 fd 主要还是由一个 file-pointer 指针所定义

## FD是如何诞生的

![](https://2314591241-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MC_ucxnzAClkrgsGdFP%2Fsync%2Fed985a9c2fafa990eec1ac41b074aaa8e6ab90db.png?generation=1605772275116945\&alt=media)

那么详细来说 fd到底是什么? **Kernel维护了一个 OPEN FILE TABLE, 你如果开一个文件, 这个表里就会多出一项, 而fd, 即file-pointer就是指向这个\[表项]的指针**. 以上这句话, 直接说明了:

1. fd是什么: 是一个指针, 指向内核维护的文件表项
2. 为什么fd进程独享吗?:&#x20;
   1. 因为OPEN FILE TABLE 记录的了 \[谁, 什么文件], 你的进程打开以后这个表项就是 \[你, 文件A] , 当然别人也可以打开同一个文件A,那么表里会再生成一项: \[他, 文件A] , 但这是另一个表项了, 因此它会拿到另一个fd, 因此我们说同一个进程下不同的线程拿到的是同一个fd
   2. 但通过复制可以拿到两个fd, 指向同一个文件表项 / 子进程通过继承拿到父进程的表项 / 不同进程之间可以通过某种Socket互传fd, 在上面的图中进程A先打开了一个文件, 生成了一个fd0, 接着我们复制这个fd0(文件描述符的复制), 得到了fd3, 接着fork出进程B, 进程B继承了父进程的fd0.  因此不是进程独享的

## 那FD是如何跟文件系统挂钩的

我们注意看一下上面的表项, 里面是不是有一项叫做inode, 这个概念你应该在硬链/软链见过一次, 一个inode号:

* 文件的 磁盘块 位置
* 文件格式, 归属权, 路径等meta信息

那么简单来说, fd → 内核文件表项 → inode → 文件系统, 你可以通过`ls -i`看看文件的inode号. 每个文件(的入口位置)都有一个inode, 因此`ls -i`出来的文件inode号其实就是文件入口的inode号.

![](https://2314591241-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MC_ucxnzAClkrgsGdFP%2Fsync%2Fd090e175340a8c6db4825d48c25a49762c5ff8ff.png?generation=1605772273191940\&alt=media)

在上面的图中, fd0/3因为是复制出来的, 因此指向同样的内核表项, 因此指向同样的inode. 而fd5是进程A打开的另一个文件, 因此指向了另一个inode号, 另一个文件
