文本處理三劍客與正則運算式詳解-有解無憂

我們知道在 Linux 中，“一切皆檔案”，作為系統管理員或者程式員我們每天都需要和大量的文本檔案打交道，Linux 系統為我們提供了三個文本處理工具：grep, sed, 和 awk，它們也被稱為 Linux 文本處理的三劍客被大家廣泛使用，今天先和大家介紹一下 grep 的以及正則運算式的用法，因為 grep 只有和正則運算式結合在一起才會發揮出它強大的威力，

Grep 的用法

grep 是一個強大的文本搜索工具，可以用于在文本檔案中搜索指定格式（正則運算式）的字串，并將匹配的行輸出，它的用法如下：

#grep [選項] 查找條件目標檔案

比如我們有一個文本檔案，littlestar.txt，它的內容如下：

TWINKLE, twinkle, little star,
How I wonder what you are!
Up above the world so high,

Like a diamond in the sky.

（1）查找一個字串

比如要查找“twinkle”

#grep "twinkle" littlestar.txt

匹配上的字串用紅色突出顯示出來了，

（2） “-i”忽略大小寫

#grep -i "twinkle" littlestar.txt

結果可以看到TWINKLE 和 twinkle 都匹配上了

（3） “-n”顯示行號

#grep -n "twinkle" littlestar.txt

發現在結果的最左側顯示行號

（4） “-c”僅顯示匹配到的行號

#grep -c "twinkle" littlestar.txt

結果僅顯示 1，表示第 1 行匹配到了查找的字串

（5） “-o” 僅顯示匹配到的字串，不顯示同行的其他內容

#grep -o "twinkle" littlestar.txt

結果僅顯示 twinkle

（6） “-w”精確匹配單詞

#grep -w "twinkle" littlestar.txt 查找twinkle

#grep -w "twink" littlestar.txt 查找twink

結果顯示完整的單詞 twinkle 可以匹配到，如果只查找 twink 則沒有匹配上

（7） “-v“ 反轉查找，顯示不包含關鍵字的行

#grep -v "twink" littlestar.txt

結果除了第一行，其他都匹配成功了

正則運算式

正則運算式（Regular Expression）是一種描述字串匹配模式的方式，它的應用非常廣泛，幾乎所有的主流編程語音里都有正則運算式的實作，比如 Java，C#，Python等等，當然 Linux 的 Shell 對它也有很好的支持，我們很多時候想要做的是模糊查找，比如以133開頭的手機號，這個時候 grep 就需要用到正則運算式了，

正則運算式有兩個版本，基本正則運算式（BRE）和它的升級版--擴展正則運算式（ERE），我們主要了解一下擴展版，grep 命令需要加上 -E 選項，或者使用 egrep 命令，

正則運算式中用來匹配字串模式的字符被稱作元字符，學習正則運算式主要就是學會元字符的組合運用，元字符主要有下面幾種：