目錄
- 1.認識Linux檔案系統
- 1.2 檔案系統特性
- 1.3 Linux的ext2檔案系統
- 1.4 檔案系統與目錄樹的關系
- 1.4.0 目錄
- 1.4.1 檔案
- 1.4.2 目錄樹讀取
- 1.4.3 檔案系統大小與磁盤讀取性能
- 1.5 ext2/ext3/ext4 檔案的存取與日志式檔案系統的功能
- 1.5.0 ext2/ext3/ext4 檔案的存取
- 1.5.1 日志式檔案系統(Journaling File System)
- 1.6 Linux檔案系統的運行
- 1.7 掛載點(mount point)的意義
- 1.8 其他Linux支持的檔案系統與VFS
- 1.8.0 Linux VFS(Virtual File System)
- 1.9 XFS檔案系統簡介(Extended File System)
1.認識Linux檔案系統
Linux最傳統的磁盤檔案系統(file system)使用的是【ext2】
檔案系統是建立在磁盤上面的
1.2 檔案系統特性
1.磁盤磁區完后需要進行格式化(format)后,作業系統(OS)才能使用這個檔案系統
為什么需要進行格式化?
因為每種OS所設定的檔案屬性/權限并不相同,為存放這些檔案所需要的資料,需要將磁區進行格式化,以成為OS能利用的檔案系統格式(file system)
2.每種OS使用的檔案系統不同
| OS型別 | 檔案系統 |
|---|---|
| Windows 98 | FAT |
| Windows 2000 | NTFS |
| Linux | ext2 |
3.檔案系統的資料存放位置

4.inode / data block 資料存取示意圖

某個檔案的屬性與權限資料是放置到 inode4號,這個 inode 記錄了檔案資料的實際放置點為 2、7、13、15 這4個區塊號碼,此時OS能按此排列磁盤的讀取順序,一次性將4個區塊內容讀出來,這種資料存取的方法稱為索引式檔案系統(indexed allocation)ext2是索引式檔案系統
對比:U盤使用的FAT檔案系統
FAT檔案系統資料存取示意圖

1.3 Linux的ext2檔案系統
檔案系統一開始就將 inode 與 data block 規劃好了,除非重新格式化(或利用 resize2fs 等命令修改其大小),否則 inode 與 data block 固定(大小和數量)后就不再變動
1.ext2 檔案系統示意圖

2.inode的結構示意圖

間接:再拿一塊block來當作記錄block號碼的記錄區,如果檔案太大,就會使用間接的block來記錄編號,如果檔案持續變大,就會利用所謂的雙間接,以此類推,三間接就是利用第三層block來記錄編號
inode能夠指定多少個 block?以較小的 1K block 為例:
| Block大小 | 1KB | 2KB | 4KB |
|---|---|---|---|
| 一個檔案最大容量 | 16GB | 256GB | 2TB |
| 檔案系統最大容量 | 2TB | 8TB | 16TB |
- 12個直接指向:12×1K=12K
由于是直接指向:所以總共可記錄 12 條記錄,因此大小為12K - 1個間接:256×1K=256K
每個block號碼的記錄會使用 4B,因此 1K 的大小能夠記錄 256 條記錄,因此一個間接可以記錄的檔案大小為256K - 1個雙間接:256×256×1K=2562K
第一層block會指定 256 個第二層,每個第二層可以指定 256 個block號碼,因此大小為2562K - 1個三間接:256×256×256×1K=2563K
第一層block會指定 256 個第二層,每個第二層可以指定 256 個第三層,每個第三層可以指定 256 個 block 號碼,因此大小為2563K - 一個檔案最大容量:將直接、間接、雙間接、三間接相加,能夠容納的最大檔案為 16GB(1MB=1024KB,1GB=1024MB)
這個方法不能用在 2K 及 4K block大小的計算中,因為大于 2K 的block將會受到 ext2 檔案系統本身的限制,所以計算結果不太符合
ext4檔案系統的 inode 容量已經可以擴大到 256B,更大的 inode 容量,可以記錄更多的檔案系統資訊,包括新的 ACL 以及 SELinux 型別等
3.利用【dumpe2fs】查詢資訊
[root@study ~] dumpe2fs [-bh] 設備檔案名
選項與引數:
-b : 列出保留為壞道的部分(一般用不到)
-h : 僅列出superblock的資料,不會列出其他的區段內容

/dev/vda5使用的區塊(圖中所述為位置)為 4K ,第一個block號碼為0號,以Block Group 0為例:

1.4 檔案系統與目錄樹的關系
目錄的內容是檔案名,一般檔案的內容是實際的資料
1.4.0 目錄
目錄與檔案在檔案系統當中是如何記錄資料的呢?

觀察root根目錄內的檔案所占用的 inode 號碼,使用【ls -i】來處理

下圖中
- 根目錄( / )使用的區塊大小為 4K(4096B)
- /boot 使用的區塊大小為 4K(4096B)
- /proc 使用的區塊大小為 0K,該目錄不占磁盤容量
- /usr/sbin 使用的區塊大小為 3個4K區塊(12288B,12288B/4096B=3)

1.4.1 檔案
Linux的ext2檔案系統建立一個一般檔案時,ext2會分配
- 一個inode
- 相對于該檔案大小的區塊數量給檔案
范例:
假設一個區塊為 4KB,想要建立一個 100 KB的檔案,那么Linux將分配一個 inode 與25個區塊(25×4K=100KB)來存盤該檔案,要注意:inode 有12個直接指向(12×4KB=48KB)再使用一個間接指向(256×4KB=1024KB)
- 直接指向:48KB
- 間接指向:52KB(100KB-48KB=52KB,剩余1024KB-52KB=972KB)

1.4.2 目錄樹讀取
檔案讀取流程
以下圖中的【/etc/passwd】為例:
(讀取者身份為 aeronautics 這個一般身份用戶)

-
/ 的inode
通過掛載點(mount point)的資訊找到 inode 號碼為 2 的根目錄 inode,且 inode 規范的權限讓我們可以讀取該區塊的內容(用戶組權限為r-x,含r和x權限) -
/ 的區塊
經過上個步驟取得的區塊的號碼,并找到該內容有【etc/】目錄的 inode 號碼(6029313) -
【etc/】的inode
讀取6029313號 inode 得知 aeronautics 具有 r 與 x 權限,因此可以讀取 【etc/】的區塊內容 -
【etc/】的區塊
經過上個步驟取得區塊號碼,并找到該內容有 passwd 檔案的 inode 號碼(6029518) -
passwd 的inode
讀取 6029518 號inode 得知 aeronautics 具有 r 的權限,因此可以讀取 passwd 的區塊內容 -
passwd 的區塊
最后將該區塊內容的資料讀出來
1.4.3 檔案系統大小與磁盤讀取性能
如果檔案寫入的區塊太分散,就會有所謂的檔案資料離散的問題,
如果檔案系統真的太大,那么當一個檔案分別記錄在這個檔案系統的最前面與最后面的區塊號碼中,此時會造成磁盤的機械手臂移動幅度過大,也會造成資料讀取性能的下降,而且磁頭在查找整個檔案系統時,也會花費比較多的時間去查找,因此,磁盤磁區的規劃并不是越大越好,而是要針對主機用途來進行規劃,
1.5 ext2/ext3/ext4 檔案的存取與日志式檔案系統的功能
1.5.0 ext2/ext3/ext4 檔案的存取
假設要新增一個檔案,檔案系統的操作如下:

- 先確定用戶對欲新增檔案的目錄是否具有w與x的權限,若有的話才能新增檔案
- 根據 inode bitmap 找到未被使用的 inode 號碼,并將新檔案的權限/屬性寫入 inode
- 根據 block bitmap 找到未被使用的 區塊號碼,并將實際的資料寫入區塊中,且更新 inode 的指向號碼
- 將剛剛寫入的 inode 與 區塊資料同步更新 inode bitmap 與 block bitmap,并更新superblock 的內容

因為 superblock、inode bitmap、block bitmap的資料經常變動,每次新增、洗掉、編輯時都可能會影響到這三個部分的資料,因此被稱為元資料(metadata)
1.5.1 日志式檔案系統(Journaling File System)
日志式檔案最基礎的功能:
當資料的記錄程序出現問題時,系統只要去檢查日志記錄的區塊,就可以知道哪個檔案發生了問題,針對該問題來做一致性的檢查即可,而不必針對整個檔案系統進行檢查,這樣就可達到快速修復檔案系統的目的,
一致性檢查的步驟:
- 預備:當系統要寫入一個檔案時,會先在日志記錄區塊中記錄某個檔案準備要寫入的資訊
- 實際寫入:開始寫入檔案的權限與資料;開始更新元資料(metadata)的資料
- 結束: 完成資料與元資料(metadata)的更新后,在日志記錄區塊當中完成該檔案的記錄
1.6 Linux檔案系統的運行
所有的資料要加載到記憶體后,CPU才能處理,
如果編輯大檔案,在編輯程序中又頻繁地要系統來寫入到磁盤中,由于磁盤寫入地速度要比記憶體慢的多,因此你會常常耗在等待磁盤的讀寫上,導致效率低下,
為解決效率問題,Linux使用異步處理(asynchronously)的方式

如果能將常用檔案放置到記憶體當中,可提高系統性能
Linux系統上面的檔案系統與記憶體間的關系
- 系統會將常用的檔案資料放置到記憶體的緩沖區,以加快檔案系統的讀寫操作
- 可手動使用【sync】來強制記憶體中設定為【Dirty】的資料寫回到磁盤中
- 若正常關機,關機命令會主動呼叫【sync】將記憶體中的資料寫入磁盤內
- 若不正常關機(如斷電、宕機或其他原因),由于資料尚未回到磁盤內,因此重新啟動后可能會花很多時間在進行磁盤校驗,甚至可能導致檔案系統的損壞(非磁盤損壞)
1.7 掛載點(mount point)的意義
每個檔案系統都有獨立的 inode、區塊、超級區塊等資訊,這個檔案系統要能夠鏈接到目錄樹才能被使用,將檔案系統與目錄樹結合的操作稱為掛載(mount)
重點:掛載點一定是目錄,該目錄為進入該檔案系統的入口

同一個檔案系統的某個 inode 只會對應到一個檔案內容而已(因為一個檔案占用一個 inode)
可以通過判斷 inode 號碼 來確認不同檔案名是否為相同的檔案

上面的資訊中由于掛載點均在 / ,因此三個檔案(/、/. 、/…)均在同一個檔案系統內,而這三個檔案的 inode 號碼均為 2 號,因此這三個檔案名都指向同一個 inode 號碼,當然這三個檔案的內容也完全一樣,(根目錄的上層【/…】就是它自己)
1.8 其他Linux支持的檔案系統與VFS

查看系統目前已加載到記憶體中支持的檔案系統:
[root@study ~] cat /proc/filesystems

1.8.0 Linux VFS(Virtual File System)

通過VFS的功能來管理所有的檔案系統,省去自行設定讀取檔案系統的行為(什么檔案系統的模塊應該對應讀取什么檔案的這種行為)
VFS示意圖

1.9 XFS檔案系統簡介(Extended File System)

XFS檔案系統的描述資料
[root@study ~] xfs_info 掛載點 | 設備檔案名
范例:
找出 /boot 這個掛載點下面的檔案系統的超級區塊記錄

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/258116.html
標籤:其他
上一篇:shell script總結大全
下一篇:詳解Linux(基礎篇)
