一、Linux系統的檔案存盤結構
在Linux系統中,目錄、字符設備、套接字、硬碟、光驅、列印機等都被抽象成檔案形式(“Linux系統一切皆檔案”),既然平時我們打交道的都是檔案,那么又應該如何找到它們呢?
在Windows作業系統中,想要找到一個檔案,要依次進入該檔案所在的磁盤磁區(也叫盤符),然后再進入該磁區下的具體目錄,最終找到這個檔案,
但是在Linux系統中并不存在C、D、E、F等盤符,Linux系統中的一切檔案都是從“根”目錄(/)開始的,并按照檔案系統層次標準(FHS)采用倒樹狀結構來存放檔案,以及定義了常見目錄的用途,
FHS是根據以往無數Linux系統用戶和開發者的經驗而總結出來的,是用戶在Linux系統中存盤檔案時需要遵守的規則,用于指導用戶應該把檔案保存到什么位置,以及告訴用戶應該在何處找到所需的檔案,FHS對于用戶來講只能算是一種道德上的約束,并非必須遵循,
Linux系統中的檔案和目錄名稱是嚴格區分大小寫的,例如,root、rOOt、Root、rooT均代表不同的目錄,并且檔案名稱中不得包含斜杠(/),
(1) Linux系統中的檔案存盤結構

(2)Linux系統中常見的目錄名稱以及相應內容
| 目錄名稱 | 應放置檔案的內容 |
| /boot | 開機所需檔案—內核、開機選單以及所需組態檔等 |
| /dev | 以檔案形式存放任何設備與介面 |
| /etc | 組態檔 |
| /home | 用戶主目錄 |
| /bin | 存放單用戶模式下還可以操作的命令 |
| /lib | 開機時用到的函式庫,以及/bin與/sbin下面的命令要呼叫的函式 |
| /sbin | 開機程序中需要的命令 |
| /media | 用于掛載設備檔案的目錄 |
| /opt | 放置第三方的軟體 |
| /root | 系統管理員的家目錄 |
| /srv | 一些網路服務的資料檔案目錄 |
| /tmp | 任何人均可使用的“共享”臨時目錄 |
| /proc | 虛擬檔案系統,例如系統內核、行程、外部設備及網路狀態等 |
| /usr/local | 用戶自行安裝的軟體 |
| /usr/sbin | Linux系統開機時不會使用到的軟體/命令/腳本 |
| /usr/share | 幫助與說明檔案,也可放置共享檔案 |
| /var | 主要存放經常變化的檔案,如日志 |
| /lost+found | 當檔案系統發生錯誤時,將一些丟失的檔案片段存放在這里 |
(3) 路徑
Linux系統的路徑指如何定位到某個檔案,分為絕對路徑和相對路徑,
- 絕對路徑:從根目錄(/)開始寫起的檔案或目錄名稱
- 相對路徑:相對于當前路徑的寫法
(4)常見的物理(硬體)設備及其檔案名稱
在Linux系統中一切都是檔案,硬體設備也不例外,既然是檔案,就必須有檔案名稱,系統內核中的udev設備管理器會自動把硬體名稱規范起來,目的是讓用戶通過設備檔案的名字可以猜出設備大致的屬性以及磁區資訊等;這對于陌生的設備來說特別方便,另外,udev設備管理器的服務會一直以守護行程的形式運行并偵聽內核發出的信號來管理/dev目錄下的設備檔案,
常用的硬體設備及其檔案名稱:
| 硬體設備 | 檔案名稱 |
| IDE設備 | /dev/hd[a-d] |
| SCSI/SATA/U盤 | /dev/sd[a-z] |
| virtio設備 | /dev/vd[a-z] |
| 軟驅 | /dev/fd[0-1] |
| 列印機 | /dev/lp[0-15] |
| 光驅 | /dev/cdrom |
| 滑鼠 | /dev/mouse |
| 磁帶機 | /dev/st0或/dev/ht0 |
一般的硬碟設備都是以“/dev/sd”開頭,而一臺主機上可以有多塊硬碟,因此系統采用a~z來代表26塊不同的硬碟(默認從a開始分配),
磁盤的磁區:
- 主磁區或擴展磁區的編號從1開始,到4結束;
- 邏輯磁區從編號5開始,
【注意】對于磁區名稱sda3只能表示是編號為3的磁區,而不能判斷sda設備已經存在了3個磁區,
示例:/dev/sda5
表示“這是系統中第一塊被識別到的硬體設備中磁區編號為5的邏輯磁區的設備檔案”
二、硬碟設備及磁區
硬碟的基礎概念
- 一個硬碟有多張盤片疊成,不同盤片有編號
- 每張盤片上的存盤顆粒成環形一圈圈地排布,每一圈稱為磁道,有編號
- 每條磁道上都有一圈存盤顆粒,每512*8(512位元組,0.5KB)個存盤顆粒作為一個扇區,扇區是硬碟上存盤的最小物理單位
- N個扇區可以組成簇,N取決于不同的檔案系統或是檔案系統的配置,簇是此檔案系統中的最小存盤單位
- 所有盤面上的同一磁道構成一個圓柱,稱為柱面,柱面是系統磁區的最小單位

硬碟設備是由大量的扇區組成的,每個扇區的容量為512位元組,其中第一個扇區最重要,它里面保存著主引導記錄(Master boot record,MBR)與磁區表(partition table)資訊,硬碟主引導記錄放有最基本的引導加載程式(boot loader),是系統開機啟動的關鍵環節,而磁區表則跟磁區有關,它記錄了硬碟磁區的相關資訊,
磁區存盤的資訊:磁區號(partition id)、磁區的起始柱面和磁區的柱面數量,Linux作業系統在初始化時就可以根據磁區表中三種資訊來識別硬碟設備,
主引導記錄需要占用446位元組,磁區表占用64位元組,結束符占用2位元組;其中磁區表中每記錄一個磁區資訊就需要16位元組,這樣一來最多只有4個磁區資訊可以寫到第一個扇區中,這4個磁區就是4個主磁區,
第一個扇區中的資料資訊:

【問題】每塊硬碟最多只能創建4個磁區嗎?
這顯然是不合理也不夠用的,為解決磁區個數不夠的問題,可以將第一個扇區的磁區表中16位元組(原本要寫入主磁區資訊)的空間(稱之為“擴展磁區”)拿出來指向另一個磁區,所以,擴展磁區其實不是一個真正的磁區,更像是一個占用16位元組磁區表空間的指標(一個指向另一個磁區的指標),這樣,用戶一般會選擇使用3個主磁區加1個擴展磁區的方法,然后再擴展磁區中創建出數個邏輯磁區,從而滿足多磁區(>4個磁區)的要求,
擴展磁區自身不能存盤資料,用戶需要在其指向的對應磁區(稱為“邏輯磁區”)上進行操作,
為什么要進行磁區?
(1)易于管理和使用:
比如說我們把磁盤分了sda1、sda2、sda3、sda4盤,我們假設sda1盤為系統盤,其他的比如說游戲、辦公、軟體盤,這樣我們要重新分哪個區就直接在對應的盤分就可以了,不需要整塊磁盤進行磁區,根據用途我們也能較快的去使用相應的磁盤,
(2)有利于資料的安全:
通過磁區可以降低資料損失的風險,出現硬碟壞道、錯誤操作、重裝系統都有可能造成資料損失,如果磁區了,那么我們就可以將損失最小化,
(3)節約尋找檔案的時間:
磁區以后,電腦搜索檔案時只需要在相對應的磁區搜索就可以了,沒必要進行全盤搜索,大大節省了尋找檔案的時間,
Linux 創建磁區命令
(1)查看磁區情況:lsblk

(2)使用fdisk工具創建磁區
fdisk工具命令集合:

①啟動fdisk工具(使用管理員權限)

②創建一個磁區n(new的縮寫)

③查看磁區p(打開磁區串列)

④洗掉磁區d (delete縮寫)

⑤保存磁區并寫入磁盤

三、檔案系統
用戶在硬體存盤設備中執行的檔案建立、寫入、讀取、修改、轉存與控制等操作都是依靠檔案系統來完成的,檔案系統的作用是合理規劃硬碟,以保證用戶正常的使用需求,
Linux系統支持數十種檔案系統,而最常見的檔案系統如下所示,
Ext2:最早可追溯到1993年,是Linux系統的第一個商業級檔案系統,它基本沿襲了UNIX檔案系統的設計標準,但由于不包含日志讀寫功能,資料丟失的可能性很大,因此大家能不用就不用,或者頂多建議用于SD存盤卡或U盤,
Ext3:是一款日志檔案系統,它會把整個硬碟的每個寫入動作的細節都預先記錄下來,然后再進行實際操作,以便在發生例外宕機后能回溯追蹤到被中斷的部分,Ext3能夠在系統例外宕機時避免檔案系統資料丟失,并能自動修復資料的不一致與錯誤,然而,當硬碟容量較大時,所需的修復時間也會很長,而且也不能100%地保證資料不會丟失,
Ext4:Ext3的改進版本,作為RHEL 6系統中默認的檔案管理系統,它支持的存盤容量高達1EB(1EB=1,073,741,824GB),且能夠有無限多的子目錄,另外,Ext4檔案系統能夠批量分配block(塊),從而極大地提高了讀寫效率,現在很多主流服務器也會使用Ext4檔案系統,
XFS:是一種高性能的日志檔案系統,而且是RHEL 7/8中默認的檔案管理系統,它的優勢在發生意外宕機后尤其明顯,即可以快速地恢復可能被破壞的檔案,而且強大的日志功能只需花費極低的計算和存盤性能,它支持的最大存盤容量為18EB(18EB等于18,874,368TB,假設每塊硬碟的容量是100TB,那么大概需要19萬塊硬碟才能把18EB的資料都裝下,),這幾乎滿足了所有需求,
在拿到一塊新的硬碟存盤設備后,先需要磁區,然后再格式化檔案系統,最后才能掛載并正常使用,硬碟的磁區操作取決于您的需求和硬碟大小;也可以選擇不進行磁區,但是必須對硬碟進行格式化處理,
類比:就像拿到了一張未裁切的完整紙張那樣,首先要進行裁切以方便使用(磁區),接下來在裁切后的紙張上畫格以便能書寫工整(格式化),最后是正式的使用(掛載),
四、硬碟格式化
Linux作業系統支持很多不同的檔案系統,比如ext2、ext3、XFS等等,而Linux把對不同檔案系統的訪問交給了VFS(虛擬檔案系統),VFS能訪問和管理各種不同的檔案系統,所以磁區完需要把它格式化成具體的檔案系統以便VFS訪問,
標準的Linux檔案系統Ext2是使用「基于inode的檔案系統」
檔案的存盤:
(1)檔案系統通常會將檔案的屬性和實際內容這兩部分資料分別存放在不同的區塊
(2)在基于inode的檔案系統中,權限與屬性放置到 inode 中,實際資料放到 data block 區塊中,而且inode和data block都有編號
存盤劃分:
(1)檔案系統最前面有一個啟動扇區(boot sector)
這個啟動扇區可以安裝開機管理程式, 這個設計讓我們能將不同的引導裝載程式安裝到個別的檔案系統前端,而不用覆寫整個硬碟唯一的MBR, 也就是這樣才能實作多重引導的功能,
(2)把每個區進一步分為多個塊組 (block group),每個塊組有獨立的inode/block體系
每個塊組實際還會分為分為6個部分,除了inode table 和 data block外還有4個附屬模塊,起到優化和完善系統性能的作用,
Linux 格式化命令
格式化命令mkfs

引數指定:
-t : 指定檔案系統的型別,Linux 的預設值為ext2,可以指定為ext3,4等
( Windows下的檔案系統有Fat32、NTFS,CentOS使用的檔案系統為ext,之前centOS5版本使用ext3作為默認的檔案系統,而CentOS6使用ext4作為默認的檔案系統)
mkfs本身并不執行建立檔案系統的作業,而是去呼叫相關的程式來執行,例如,若在"-t" 引數中指定ext2,則 mkfs會呼叫mke2fs 來格式化創建檔案系統,

mkfs.ext3 mkfs.reiserfs mkfs.ext2 mkdosfs mkfs.msdos mkfs.vfat ,通過檔案名,我們知道這些工具是支持什么檔案系統,
檔案系統存盤結構
ExtX檔案系統存盤結構如下圖所示:

Super block(超級塊):存放檔案系統本身的結構資訊,記錄的主要資訊:
- block和inode的總量、使用量、未使用量
- block和inode的大小
- 檔案系統的最近一次掛載時間、最近一次寫入資料的時間等
- 一個validbit 數值,若此檔案系統已被掛載,則valid bit為0,否則為1
GDT(Group Description Table ,塊組描述符):描述每個塊組屬性資訊,包括塊組(block group)的開始與結束號,以及說明每個段區(superblock、bitmap、inode map、data block)分別介于哪個block號之間,
inode Bitmap(inode 位圖):每個bit表示一個inode是否空閑可用,
Block Bitmap(塊位圖):記錄著Data block 資料塊的占用情況,
inode Table(節點表):記錄檔案的屬性以及檔案實際資料的位置,
(每個檔案僅占用一個inode,每個inode大小固定為128位元組,記錄一個block消耗4位元組,當檔案的inode被寫滿后,Linux系統會自動分配出一個block,專門用于像inode那樣記錄data block塊的資訊)
- 該檔案的訪問權限(read、write、execute);
- 該檔案的所有者與所屬組(owner、group);
- 該檔案的大小(size);
- 該檔案的創建或內容修改時間(Ctime);
- 該檔案的最后一次訪問時間(Atime);
- 該檔案的修改時間(Mtime);
- 檔案的特殊權限(SUID、SGID、SBIT);
- 該檔案的真實資料地址(point),
Data Block(資料塊):存放具體檔案內容,
檔案系統中所支持的 block 大小通常有1kB、2KB及4KB三種,在格式化時,block的大小就固定了,且每個block都有編號,以便inode記錄,由于block大小的差異,會導致該檔案系統能夠支持的最大磁盤容量與最大單一檔案容量并不相同,
對于存盤檔案內容的block塊,有下面兩種常見的情況(以4KB大小的block為例進行說明)
- 情況1:檔案很小(1KB),但依然會占用一個block(剩余容量不會被使用),因此會潛在地浪費3KB,
- 情況2:檔案很大(5KB),那么會占用兩個block(5KB?4KB后剩下的1KB也要占用一個block),
| Block 大小 | 1KB | 2KB | 4KB |
| 最大單一檔案限制 | 16GB | 256GB | 2TB |
| 最大檔案系統總容量 | 2TB | 8TB | 16TB |
最大單一檔案容量的計算方法
一個檔案對應一個inode,ext2檔案系統為了讓inode記錄盡可能多的data block,定義了四個記錄block號碼的區域,分別為12個直接記錄區,1個間接記錄區,1個雙間接記錄區,1個三間接記錄區,所謂間接記錄區就是用data block記錄data block號碼.

以每個 block 的大小1KB為例:
?(1) 12個直接指向:12 × 1K = 12 K (一個直接記錄區記錄一個data block號碼,一個data block 1K)
?(2) 1個間接:256 × 1K = 256 K (一次間接指標指向一個data block,由該data block間接記錄檔案data block號碼,由于data block為1K,記錄一個data block要4byte,所以一個data block可以保持1024 / 4 = 256 個data block號碼)
(3) 1個雙間接:256 × 256 × 1K = 65526 K
(4)1個三間接:256 × 256 × 256 × 1K = 16,777,216K
最大單一檔案容量等于四個記錄區容量的總和,12 + 256 + 65526 + 6,777,216 = 116,843,010 K,約等于16G,
【注意】該方法僅限于<2k的block,受到檔案系統本身的限制,ext2檔案系統限制單個檔案最大容量為2T,
虛擬檔案系統(Virtual File System,VFS)
為了使用戶在讀取或寫入檔案時不用關心底層的硬碟結構,Linux內核中的軟體層為用戶程式提供了一個虛擬檔案系統(Virtual File System,VFS)介面,這樣用戶實際上在操作檔案時就是統一對這個虛擬檔案系統進行操作了,如下VFS的架構示意圖所示,從中可見,實際檔案系統在VFS下隱藏了自己的特性和細節,這樣用戶在日常使用時會覺得“檔案系統都是一樣的”,也就可以隨意使用各種命令在任何檔案系統中進行各種操作了,

使用Linux命令查看inode資訊
(1) 查看檔案的inode資訊:stat


(2) 查看檔案型別:file
![]()
![]()
(3) 查看inode號碼:ls -i
![]()
![]()
(可以看到stat命令中也有Inode,22360就是inode號)
(4) 查看硬碟磁區的inode數量和使用情況:df -i

五、掛載
在一個區被格式化為一個檔案系統之后,它就可以被Linux作業系統使用了,只是這個時候Linux作業系統還找不到它,所以我們還需要把這個檔案系統注冊進Linux作業系統的檔案體系里,這個操作就叫掛載 (mount),
掛載是利用一個已存在的目錄檔案當成進入點(類似選一個現成的目錄作為代理),將檔案系統放置(關聯)在該目錄下,也就是說,進入該目錄就可以讀取該檔案系統的內容,類似整個檔案系統只是目錄樹的一個檔案夾(目錄),
這個進入點的目錄我們稱為掛載點,
由于整個 Linux 系統最重要的是根目錄,因此根目錄一定需要掛載到某個磁區, 而其他的目錄則可依用戶自己的需求來給予掛載到不同的分去,
【小結】
硬碟經過磁區和格式化,每個區都成為了一個檔案系統,掛載這個檔案系統后就可以讓Linux作業系統通過VFS訪問硬碟時跟訪問一個普通檔案夾一樣,
Linux掛載和卸載命令
掛載mount

卸載umount

強制卸載加引數-l
![]()
六、檔案尋址(檔案讀取)
一個檔案由一個目錄項、inode、資料區域塊組成,
目錄結構:
在 Linux 下的 ext2 檔案系統創建一個目錄時, ext2 會分配一個 inode 與至少一塊 block 給該目錄,
inode 記錄該目錄的相關權限與屬性,并可記錄分配到的那塊 block 號碼
block 則是記錄在這個目錄下的檔案名與該檔案名占用的 inode 號碼資料.
如下圖所示:


上面的圖描述的是查看檔案的流程,從圖中可以看出 tmp/ 目錄檔案對應的 Block 塊中存盤的是該目錄下檔案名以及檔案名對應的 inode 號碼,而 a.txt、c.txt 檔案對應的 Block 塊中存盤的是 a.txt c.txt 檔案的內容
由于目錄樹是由根目錄(/)開始讀起,因此系統透過掛載的資訊可以找到掛載點的 inode 號碼(通常一個 檔案系統 的最頂層 inode 號碼會由 2 號開始),此時就能夠得到根目錄的 inode 內容,并依據該 inode 讀取根目錄的 block 內的檔案名資料,再一層一層的往下讀,
現以查看 a.txt 檔案內容為例,說明在檔案系統是如何查看檔案內容的:
① 透過掛載點的資訊找到 inode 號碼為 2 的根目錄 inode,根據 inode 的訪問權限判斷是否可以讀取該 block 的內容 ;
② 從inode中取得 block 的號碼,并找到該內容有 tmp/ 目錄的 inode 號碼 (131098);
③ 根據 tmp/ 目錄檔案對應的 inode 號碼 (131098) 找到 tmp/ 目錄檔案對應 Block 資料塊
④ 從 tmp/ 目錄檔案對應的 Block 塊中找出 a.txt 檔案對應的 inode 號碼 (131101)
⑤ 從 a.txt 檔案對應的 inode 資訊 中找到對應的 Block 塊
⑥ 讀出 a.txt 檔案對應的 Block 塊中的資料(this is a.txt file)
七、 軟硬方式鏈接
在Windows系統中,快捷方式就是指向原始檔案的一個鏈接檔案,可以讓用戶從不同的位置來訪問原始的檔案;原檔案一旦被洗掉或剪切到其他地方,會導致鏈接檔案失效,但是,這個看似簡單的東西在Linux系統中可不太一樣,Linux系統中存在軟鏈接和硬鏈接兩種不同的型別,
軟鏈接(soft link):也叫符號鏈接(symbolic link),僅僅包含所鏈接檔案的名稱和路徑,很像一個記錄地址的標簽,當原始檔案被洗掉或移動后,新的鏈接檔案也會隨之失效,不能被訪問,可以針對檔案、目錄設定軟鏈接,跨檔案系統進行鏈接也不是問題,從這一點來看,它與Windows系統的“快捷方式”具有一樣的性質,(可以通過readlink查看其指向)

硬鏈接(hard link):可以將它理解為一個“指向原始檔案block的指標”,系統會創建出一個與原來一模一樣的inode資訊塊,所以,硬鏈接檔案與原始檔案其實是一模一樣的,只是名字不同,每添加一個硬鏈接,該檔案的inode個數就會增加1;而且只有當該檔案的inode個數為0時,才算徹底將它洗掉,換言之,由于硬鏈接實際上是指向原檔案block的指標,因此即便原始檔案被洗掉,依然可以通過硬鏈接檔案來訪問,需要注意的是,由于技術的局限性,不能跨磁區對目錄檔案進行硬鏈接,

【注意】目錄檔案的"鏈接數",創建目錄時,默認會生成兩個目錄項:"."和"..",前者的inode號碼就是當前目錄的inode號碼,等同于當前目錄的"硬鏈接";后者的inode號碼就是當前目錄的父目錄的inode號碼,等同于父目錄的"硬鏈接",所以,任何一個目錄的"硬鏈接"總數,總是等于2加上它的子目錄總數(含隱藏目錄),是不能對目錄做硬鏈接,
Linux 命令創建檔案的軟硬鏈接ln(全稱“link”)
語法格式:
ln [引數] 原始檔案名 鏈接檔案名
引數:
創建軟鏈接示例:


由上圖可知,新創建的軟鏈接檔案test_softlink.txt和test.txt檔案內容是一致的,但是兩個檔案對應的inode號碼是不一樣的,

當刪掉原始檔案test.txt 后,軟鏈接檔案test_softlink.txt立刻就無法讀取了,
創建硬鏈接示例:


由上圖可以看到,源檔案與目標檔案的inode號碼相同,都指向同一個inode,硬鏈接數變成了2(這表示的是檔案的inode資訊塊的數量變為2),test_hardlink.txt型別也成為了普通檔案,
![]()
洗掉源檔案test.txt,后仍然可以打開test_hardlink.txt檔案,

洗掉一個檔案名test.txt,使得inode節點中的"鏈接數"減1(僅僅洗掉了一個指向真實檔案的指標而已),但是它的鏈接數并沒有減為0,所以這個檔案資料塊并沒有洗掉,
參考鏈接:
(1) Inode與block詳解【圖文】_moakia_51CTO博客
(2)理解 Linux 中的 inodes - Linux開發那些事兒 - 博客園 (cnblogs.com)
(3)Linux inode 詳解 - LinSenGeGe - 博客園 (cnblogs.com)
(4)存盤管理:Linux中磁盤的管理(磁區、格式化、掛載)、LVM_wangxu_190的博客-CSDN博客
(5)Linux檔案系統(inode、block……) - xumenger - 博客園 (cnblogs.com)
(6)磁盤檔案系統-深決議_小一!的博客-CSDN博客
(7)Linux軟連接和硬鏈接 | 滿江風雪 (metmoon.com)
(8)第6章 存盤結構與管理硬碟 | 《Linux就該這么學》 (linuxprobe.com)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/342326.html
標籤:其他
上一篇:vmware橋接模式下無法聯網

