10. 怎么什么东西都是fd
Last updated
Was this helpful?
Last updated
Was this helpful?
想要深刻理解epoll是怎么工作的, 就必须先对fd有一个深刻的理解
一个程序是怎么跟文件系统挂钩的, 为什么一个程序能通过一个文件描述符控制文件.
一个进程能通过"描述符"控制IO-stream, 无论你怎么看, 文件, socket, tty 在本质上都是一种IO-stream, 因为我们都可以从这三者里取出byte数组, 因此在操作系统眼里看来你们都是byte数组的提供方, 就都可以用 fd 指代. 那我们今天要解释的问题就是进程是如何通过fd指代到文件的.
每一个进程都会维护一个table, 里面维护了他要访问的fd, 一个fd既可以通过open / pipe / socket 这样的方式显式的创建出来, 同时可以是从父进程那里继承过来的. 但总之他有一张表, 里面罗列了所有的fd. 我们从上面的图看下一个 fd 主要还是由一个 file-pointer 指针所定义
那么详细来说 fd到底是什么? Kernel维护了一个 OPEN FILE TABLE, 你如果开一个文件, 这个表里就会多出一项, 而fd, 即file-pointer就是指向这个[表项]的指针. 以上这句话, 直接说明了:
fd是什么: 是一个指针, 指向内核维护的文件表项
为什么fd进程独享吗?:
因为OPEN FILE TABLE 记录的了 [谁, 什么文件], 你的进程打开以后这个表项就是 [你, 文件A] , 当然别人也可以打开同一个文件A,那么表里会再生成一项: [他, 文件A] , 但这是另一个表项了, 因此它会拿到另一个fd, 因此我们说同一个进程下不同的线程拿到的是同一个fd
但通过复制可以拿到两个fd, 指向同一个文件表项 / 子进程通过继承拿到父进程的表项 / 不同进程之间可以通过某种Socket互传fd, 在上面的图中进程A先打开了一个文件, 生成了一个fd0, 接着我们复制这个fd0(文件描述符的复制), 得到了fd3, 接着fork出进程B, 进程B继承了父进程的fd0. 因此不是进程独享的
我们注意看一下上面的表项, 里面是不是有一项叫做inode, 这个概念你应该在硬链/软链见过一次, 一个inode号:
文件的 磁盘块 位置
文件格式, 归属权, 路径等meta信息
那么简单来说, fd → 内核文件表项 → inode → 文件系统, 你可以通过ls -i
看看文件的inode号. 每个文件(的入口位置)都有一个inode, 因此ls -i
出来的文件inode号其实就是文件入口的inode号.
在上面的图中, fd0/3因为是复制出来的, 因此指向同样的内核表项, 因此指向同样的inode. 而fd5是进程A打开的另一个文件, 因此指向了另一个inode号, 另一个文件