Linux文件系统的inode、数据区块与文件大小的关系

我们知道文件系统在格式化的时候会创建多个区块群组(block group)，每个区块群组又包含inode表，inode对应表，数据区块(block)，区块对应表，文件系统描述，超级区块等，那么文件系统是如何运作的？

首先文件的权限(rwx)和文件的属性(owner，group，时间参数等)数据是存放在inode中，实际数据存放在数据区块中，超级区块则是记录整个文件系统的整体信息，包括inode与数据区块的总量，使用量，剩余量等。

每个inode和数据区块都有编号，我们需要了解的是：

inode：记录文件属性，一个文件占用一个inode，同时记录此文件的数据所在的区块号码；
数据区块：记录实际数据。每个区块最多只能存放一个文件。这和Windows的NTFS文件系统的簇的概念差不多。当文件大小小于数据区块大小时，则文件也会占用整个区块；如果大于数据区块大小，那么占用多个区块。比如数据区块大小为4K，文件大小为1K，那么这个文件也会占用4K的空间。所以服务器要根据实际情况规划区块的大小，从而减少磁盘空间的浪费。
超级区块：记录整个文件系统的整体信息，包括inode与数据区块的总量，使用量，剩余量等。

假如一个文件的属性记录在inode 3号，而inode 3号记录了文件数据实际存放的区块号码为3，5，7，那么系统就能够根据区块号码找到文件的实际数据，这种方法称为索引式文件系统。

在Windows系统优化常常会提到碎片整理。碎片整理的原理就是将文件过于离散的区块整合到一起，从而加快文件的读取速度。

了解以上概念之后，我们现在来讨论inode、数据区块与文件大小的关系。

以CentOS7为例：

我们要知道的是inode记录一个数据区块要占用4B的空间，假设有一个4MB大小的文件，那么inode至少需要1000个区块的记录。那么系统是如何实现的？系统将inode记录区块号码的区域指向区块来记录文件区块号码。

inode将记录区块号码的区域定义为12个直接，一个间接，一个双间接，一个三间接记录区。

示意图如下（图源网络，侵权请联系删除）：

概念如下：

也就说如果文件少于12条区块记录，inode本身就可以记录；如果大于12条记录，那么就需要借用区块来记录编号。

以4096B(4K)大小的区块来计算系统单个最大文件限制：

这时候你可能比较好奇，书上指出当block大小为4K时单个文件大小上限是2TB，那是因为Linux内核中对单文件上限upper_limit做了2T的限制，所以块大小为4k时，单文件最大为2T。

如果block大小为1K，那么就是256*256*256*1K=16384MB=16GB

「文章如果对你有帮助，请点个赞哦^^ 」

若无特殊注明，文章均为本站原创或整理发布。