面试 | Linux 下软链接和硬链接的区别

在 Linux 系统中,一切都是文件,然而为了区分不同类型的事物,我们有了:
- 普通文件
- 目录文件
- 链接文件
- 设备文件
在之前的文章《阿里面试题 | Nginx 所使用的 epoll 模型是什么?》中我们讨论了文件描述符的概念:
文件描述符(file descriptor)是内核为了高效管理已被打开的文件所创建的索引,其值是一个非负整数(通常是小整数),用于指代被打开的文件,所有执行 I/O 操作的系统调用都通过文件描述符。

对于 Linux 有一些使用的用户来说,会有类似如下的写法:
g++ lots_of_errors 2>&1 | head
其中 2>&1 中的2 就是表示的「标准错误」,1 就是「标准输出」,中间的 & 表示后面跟的数字是文件描述符而不是一个文件(不然所有的「标准错误」就都重定向到了一个名为 1 的文件中了)。
本文将针对另一个面试重点进行展开阐述:
说说看 Linux 下有哪几种链接?软链接和硬链接?它们之间的区别是什么呢?
Linux 下的链接
作为的一个 Linux 的使用者,Linux 系统下提供 ln 指令来进行文件链接,我们一定见过类似如下指令:

此时如果 ls 查看当前目录下的文件的话,会发现:

那么这个 foo.txt 究竟是个什么呢?
这个就是一个文件链接,文件链接主要分为硬链接和软链接,通过查看 ln --help,可以看到一些重要的内容:

ln 指令默认创建的是硬链接,如果加入了 -s 参数,则会生成一个软链接。
硬链接
先来看看 ln 默认创建的硬链接,由于 Linux 下的文件是通过索引节点(Inode)来识别文件,在 Linux 的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode Number)。

在 Linux 中,多个文件名指向同一索引节点是存在的,所以硬连接指通过索引节点来进行的连接,即每一个硬链接都是一个指向对应区域的文件。
我们这里创建一个文件 foo.txt 然后建立一个它的硬链接看看:

前面的 6817859是文件的 inode,可以简单把它想成 C 语言中的指针,它指向了物理硬盘的一个区块,事实上文件系统会维护一个引用计数,只要有文件指向这个区块,它就不会从硬盘上消失,这里我们会发现,这两个文件拥有相同的 inode,通过查看文件内容也会发现是同一个文件:

硬链接的作用是允许一个文件拥有多个有效路径名,这样用户就可以建立硬链接到重要文件,以防止“误删”的功能,由于对应该目录的索引节点有一个以上的连接,假设我们删除了原始的 foo.txt 文件:

此时文件的内容依然存在,所以只删除一个连接并不影响索引节点本身和其它的连接,只有当最后一个链接被删除后,文件的数据块及目录的连接才会被释放,也就是说,文件才会被真正删除。
软链接

软链接又叫符号链接,这个文件包含了另一个文件的路径名,例如在上图中,foo.txt 就是 bar.txt 的软连接,bar.txt 是实际的文件,foo.txt 包含的是对于 bar.txt 的 inode 的记录。
软连接可以是任意文件或目录,可以链接不同文件系统的文件,在对符号文件进行读或写操作的时候,系统会自动把该操作转换为对源文件的操作,但删除链接文件时,系统仅仅删除链接文件,而不删除源文件本身,这一点类似于 Windows 操作系统下的快捷方式。
软链接和硬链接的区别
在有了上面的知识后我们就可以简要地回答面试中的问题了:
软链接和硬链接的区别是什么?
我们来总结一下:

在掌握了链接方面的知识之后,还有以下相关面试题也可以一起准备起来:
- Linux 文件系统有哪些
- Linux 有哪些文件类型
- 用户进程间通信主要哪几种方式
- 中断与系统调用的概念