摘要

本文将介绍如何在 Linux 中为文件创建硬练级和符号(软)链接,并探讨两者之间的相同和不同之处。

引言

符号链接与 Windows 中的快捷方式很像。Windows 中的快捷方式是一个带箭头的图标,空间占用一般很小,仅仅提供了一个指向目标文件的通道,Linux 中的符号链接也类似。符号链接应用很灵活,可以为任意文件创建符号链接。

虽然硬链接名字里面也有链接二字,但其与符号链接还是相当不一样的。要理解硬链接,我们得先了解若干基本概念。首先我们得搞明白 Linux 的文件是如何存储中,在 Linux 中当划分磁盘分区并格式化的时候,整个分区会被划分为两部分,即 Inode 区和 Data Block 区。

Linux 中每个文件都被分成两部分存放,一部分是文件的唯一标识,Inode-number 以及属性信息放在 Inode 区的一个 inode 中,Inode-number 和 inode 是一一对应的;另一部分是文件的实际数据,放在 Data Block 区中,在 Linux 中我们需要通过文件的 inode 来找到存放文件数据的 data block。在一个硬盘分区,不可能有两个文件公用一个 inode。自然也不可能有两个文件的 inode-number 是一样的。

如果我们将硬盘分区中所有的文件比作样一本书的话,inode 区就是其目录,data block 区对应其内容。我们必须通过目录才能找到具体的内容。我们可以通过 ls -il 列出文件的 inode-number(列出的第一个字段就是)。至此,我们初步弄明白了 Linux 中的文件到底是如何存储的,接下来我们还得弄明白 Linux 中的目录到底是怎样的文件。

Linux 中目录是一张表,每个表项代表一个文件。目录中有多少文件,就有多少表项。每个表项都包括两样数据,一是文件名,再就是 inode-number。因此 Linux 中存取文件的过程就是,通过文件名找到对应的 inode-number,再找到 inode,最后找到对应的数据。

硬链接就是在目录这张表中,让一个 inode-number 对应了多个文件名,文件 inode 和数据还是一份,没有变,只不过文件多了一个名字,这个名字就称为硬链接。

用法

符号链接

Linux 中使用 ln (link 的缩写)命令加上 -s(symbolic 的缩写) 选项创建符号链接。

ln -s [链接指向的文件] [链接名]

  • ln -s test/hello.sh hello:为 test 目录下的 hello.sh 文件创建一个名为 hello 的符号链接
$ mkdir test # 创建 test 目录
$ touch test/hello.sh # 在 test 目录下创建 hell.sh 文件
$ vi test/hello.sh # 编辑 test 目录下的 hello.sh 文件,写入内容:echo "hello"
$ ln -s test/hello.sh hello # 为 test 目录下的 hello.sh 文件创建名为 hello 的符号链接
$ chmod 764 test/hello.sh # 修改 test 目录下的 hello.sh 的权限为可执行
$ ls -l # 以长格式列出当前工作目录下的文件
总用量 4
lrwxrwxrwx 1 sdxx09 sdxx09   13 67 09:31 hello -> test/hello.sh
drwxrwxr-x 2 sdxx09 sdxx09 4096 67 09:30 test
$ ./hello # 直接执行 hello 可以打印出 hello 了,而不用转到 test 目录下去执行 hello.sh 文件(这就是符号链接的好处)
hello
$ rm test/hello.sh
$ ls -l
总用量 4
lrwxrwxrwx 1 sdxx09 sdxx09   13 67 09:31 hello -> test/hello.sh # (这里会标红)
drwxrwxr-x 2 sdxx09 sdxx09 4096 67 09:42 test
$ ./hello
-bash: ./hello: 没有那个文件或目录

虽然我们可以通过符号链接文件来读、写和执行文件,但却不代表符号链接文件和源文件是同一个文件。如果符号链接文件指定的源文件被删除,那这个符号链接文件就会失效(用 ls -l 列出会发现标红),读取或执行会显示“没有哪个文件或目录”的提示,这种情况下,我们就称这个符号链接断裂了。

硬链接

Linux 中使用 ln (link 的缩写)命令创建硬链接。

ln [链接指向的文件] [链接名]

  • ln 1.txt 2.txt:为 1.txt 文件创建一个名为 2.txt 的硬链接
$ touch 1.txt
$ ls -il
总用量 0
18388234 -rw-rw-r-- 1 sdxx09 sdxx09 0 67 10:08 1.txt
$ ln 1.txt 2.txt
$ ls -il
总用量 0
18388234 -rw-rw-r-- 2 sdxx09 sdxx09 0 67 10:08 1.txt
18388234 -rw-rw-r-- 2 sdxx09 sdxx09 0 67 10:08 2.txt
$ ln 1.txt 3.txt
$ ls -il
总用量 0
18388234 -rw-rw-r-- 3 sdxx09 sdxx09 0 67 10:08 1.txt
18388234 -rw-rw-r-- 3 sdxx09 sdxx09 0 67 10:08 2.txt
18388234 -rw-rw-r-- 3 sdxx09 sdxx09 0 67 10:08 3.txt
$ rm 2.txt
$ ls -il
总用量 0
18388234 -rw-rw-r-- 2 sdxx09 sdxx09 0 67 10:08 1.txt
18388234 -rw-rw-r-- 2 sdxx09 sdxx09 0 67 10:08 3.txt
$ rm 3.txt
$ ls -il
总用量 0
18388234 -rw-rw-r-- 1 sdxx09 sdxx09 0 67 10:08 1.txt

创建前后,文件属性的第三个字段发生了改变,由一变成了二,表示文件的硬链接数目增加了一。当我们再为 1.txt 创建一个硬链接 3.txt 时,此时文件的硬链接数目变成了 3。但我们清楚,1.txt、2.txt、3.txt 本质上都是同一个文件。只不过这个文件有多个名字罢了。我们通过观察其 inode-number 可以发现,都是一样的,充分说明了这三个文件名实质上都指向了同一个文件。我们可以通过任意一个硬链接文件来读写和执行源文件。

如果将源文件删除掉,创建的硬链接并不会像符号链接一样断裂。不过文件属性中的硬链接数据会减一。我们为 1.txt 文件创建了两个硬链接 2.txt 和 3.txt,那么就相当于这个文件在文件系统中有了三个文件名。这三个文件名都指向同一个文件内容,有点像狡兔三窟的感觉。删除了一个文件,只是将某个文件名从文件系统中移除了,我们仍然能通过余下的文件名来访问这个文件的数据。事实上,只要文件还存在一个文件名,这个文件就一切正常。除非,你将三个文件都删除,我们才无法通过文件名找到文件 inode,进而访问文件数据,文件这才叫真真被删除。

硬链接由于文件系统限制,不如符号链接灵活。有两条需要注意:

  1. 强烈不推荐为目录创建硬链接。容易造成目录遍历死循环。具体原因很复杂,想了解的可以点击这里查看。
  2. 不能跨硬盘分区创建硬链接。比如你不能在 sda1 分区中创建一个指向 sda2 分区中源文件的硬链接。原因很简单,在不同的分区中文件的 inode-number 不再是唯一的。

参考

中国大学 MOOC | Linux系统管理 | 主题04 | 小节 2 | 创建文件链接

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐