今天我們來思考一個簡單的問題,在Linux下你用touch命令新建一個空檔案:
touch empty_file.txt
操作完成后,是否要消耗掉我們的一些磁盤空間?需要的話,大概能消耗多少?嗯,是的,這個問題簡單的超乎你的想象,但是不知道你否能給你自己一個滿意的答案,
我前面的幾篇文章都是介紹的磁盤物理層面的構成,但這對于理解檔案相關的問題幫助可能還不夠,從今天開始讓我們從物理層往上走,到Linux檔案系統原理里去尋找答案,
實踐出真知
我覺得可能先丟開內核原理,直接動手操作來實驗更有意思一些,你一定知道ls這個命令你可以查看檔案大小,那么讓我們就用它來看一下,
# touch abcdefghigklmn.txt
# ls -l
total 0
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file
額,ls命令告訴我這個空檔案占用的是0, 檔案的大小確實是0,因為我們還沒有為該檔案寫入任何內容,但是我們現在要思考的是,一個空檔案是否占用磁盤空間,所以直覺告訴我們這絕對不可能,磁盤上多出來一個檔案,怎么可能一點空間開銷都沒有!
為了解開這個謎底,還需要借助df命令,輸入df –i
# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
......
/dev/sdb1 2147361984 12785019 2134576965 1% /search
這個輸出幫我們展示了我們檔案系統中inode的使用情況,注意IUsed是12785019,我們繼續新建一個空檔案
# touch empty_file2.txt
df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
......
/dev/sdb1 2147361984 12785020 2134576964 1% /search
[@bjzw_46_76 temp]#
這下注意IUsed變成了12785020,
哈哈,我們的一個結論就出來了,新建一個空檔案會占用一個Inode,
細說inode
那么inode里都存了哪些和檔案相關的資訊呢?我們再稍微看一下內核的源代碼,大家可以下載一份linux的源代碼,以ext2檔案系統為例,在我下載的linux-2.6里的檔案fs/ext2/ext2.h中,可以找到內核對于inode結構體的定義,該結構體較為復雜,主要存盤除了檔案內容以外的一些其他資料,我們選一些比較關鍵的截取出來:
struct ext2_inode {
__le16 i_mode; # 檔案權限
__le16 i_uid; # 檔案所有者ID
__le32 i_size; # 檔案位元組數大小
__le32 i_atime; # 檔案上次被訪問的時間
__le32 i_ctime; # 檔案創建時間
__le32 i_mtime; # 檔案被修改的時間
__le32 i_dtime; # 檔案被洗掉的時間
__le16 i_gid; # 檔案所屬組ID
__le16 i_links_count; # 此檔案的inode被連接的次數
__le32 i_blocks; # 檔案的block數量
......
__le32 i_block[EXT2_N_BLOCKS]; # 指向存盤檔案資料的塊的陣列
......
可以看到和檔案相關的所屬用戶、訪問時間等都是存在inode中的,另外在include/linux/fs.h中,還有個VFS層面的inode的定義,這里咱就不發散了,使用stat命令就可以直接看到檔案inode中資料,
# stat test
File: `test'
Size: 0 Blocks: 0 IO Block: 1024 regular empty file
Device: 801h/2049d Inode: 26 Links: 1
Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800
每個inode到底是多大呢?dumpe2fs可以告訴你(XFS的話使用xfs_info),
# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size: 256
Inode size表示每個Inode的大小,我的這臺機器上,每個inode都是256位元組,兩個inode的大小正好對齊到磁盤扇區的512位元組,
檔案名存到哪里了
inode結構體都看完了,搞了半天不知道有沒有發現一個問題,inode里并沒有存盤檔案名!!那么,檔案名到底跑哪兒去了?
在fs/ext2/ext2.h中,我找到了如下檔案夾相關的結構體
struct ext2_dir_entry {
__le32 inode; /* Inode number */
__le16 rec_len; /* Directory entry length */
__le16 name_len; /* Name length */
char name[]; /* File name, up to EXT2_NAME_LEN */
};
這個結構體就是我們司空見慣的檔案夾,沒錯,檔案名是存在其所屬的檔案夾資料結構中的,就是其中的char name[]欄位,和檔案名一起,檔案夾里還記錄了該檔案的inode等資訊,
結論
-
- 新建一個空檔案需要消耗掉一個inode,用來保存用戶、創建時間等元資料,
-
- 新建一個空檔案還需要消耗掉其所有目錄的block中一定的空間,這些空間用來保存檔案名,權限、時間等資訊
所以,看起來新建一個空檔案而已,只要你想挖,真的能挖出很多知識的,最后分享一個我們團隊里同學遇到的一個故障,我們的一臺離線任務機直接歇菜了,重啟后排查原因是inode被消耗光了,再追查發現一個行程創建了太多的空日志檔案,雖然檔案都是空檔案,但是inode卻被浪費光了,后來讓負責的同學修改了創建日志檔案的邏輯,刪掉了多出來的空檔案,該機器恢復正常,

開發內功修煉之硬碟篇專輯:
- 1.磁盤開篇:扒開機械硬碟堅硬的外衣!
- 2.磁盤磁區也是隱含了技術技巧的
- 3.我們怎么解決機械硬碟既慢又容易壞的問題?
- 4.拆解固態硬碟結構
- 5.新建一個空檔案占用多少磁盤空間?
- 6.只有1個位元組的檔案實際占用多少磁盤空間
- 7.檔案過多時ls命令為什么會卡住?
- 8.理解格式化原理
- 9.read檔案一個位元組實際會發生多大的磁盤IO?
- 10.write檔案一個位元組后何時發起寫磁盤IO?
- 11.機械硬碟隨機IO慢的超乎你的想象
- 12.搭載固態硬碟的服務器究竟比搭機械硬碟快多少?
我的公眾號是「開發內功修煉」,在這里我不是單純介紹技術理論,也不只介紹實踐經驗,而是把理論與實踐結合起來,用實踐加深對理論的理解、用理論提高你的技術實踐能力,歡迎你來關注我的公眾號,也請分享給你的好友~~~
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/203576.html
標籤:PHP
