主頁 > 資料庫 > shell編程之正則運算式

shell編程之正則運算式

2020-09-14 01:03:26 資料庫

正則運算式(regular expression, RE)是一種字符模式,用于在查找程序中匹配指定的字符,在大多數程式里,正則運算式都被置于兩個正斜杠之間;例如/l[oO]ve/就是由正斜杠界定的正則運算式,它將匹配被查找的行中任何位置出現的相同模式,在正則運算式中,元字符是最重要的概念,

工具:被vim、sed、awk、grep呼叫

場景:mysql、oracle、php、python ,Apache,Nginx... 需要正則

一、元字符

元字符是這樣一類字符,它們表達的是不同于字面本身的含義

1、基本正則運算式元字符

^ 行首定位符

[root@localhost ~]# grep "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin


[root@localhost ~]# grep "^root" /etc/passwd  //以root開頭的
root:x:0:0:root:/root:/bin/bash

$ 行尾定位符

[root@master1 ~]# grep "love$" 1.txt  //以love為結尾的
love
ilove

. 匹配單個任意字符

[root@localhost ~]# grep abc 1.txt
abc
[root@localhost ~]# grep adc 1.txt
adc
[root@localhost ~]# grep a.c 1.txt
abc
adc

* 匹配前導符0到多次

[root@localhost ~]# cat 1.txt 
a
ab
abc
abcd
abcde
abcdef
ggg
hhh
iii
[root@localhost ~]# grep "abc*" 1.txt 
ab
abc
abcd
abcde
abcdef
[root@localhost ~]# grep "abcd*" 1.txt 
abc
abcd
abcde
abcdef

.* 任意多個字符

[root@localhost ~]# grep ".*" 1.txt 
a
ab
abc
abcd
abcde
abcdef
ggg
hhh
iii

[] 匹配指定范圍內的一個字符

[lL]ove   //Love和love都可以輸出出來

[-] 匹配指定范圍內的一個字符,連續的范圍

[a-z0-9]ove       

[^] 匹配不在指定組內的字符 (取反)

[root@localhost~]# cat  1.txt
love
1ove
|ove

[root@localhost~]# grep [0-9a-Z]ove  1.txt
love
1ove
[root@localhost ~]# grep [^0-9a-Z]ove 1.txt
|ove

\ 用來轉義元字符 ('' "" \),脫意符


[root@localhost ~]# grep "l." 1.txt 
love
l.ve
[root@localhost ~]# grep "l\." 1.txt 
l.ve

\< 詞首定位符 //以什么為詞的開頭

[root@localhost ~]# grep "love" 1.txt 
love
iloveyou
[root@localhost ~]# grep "\<love" 1.txt 
love

\> 詞尾定義符

love\>    //以love為詞的結尾

() 稍后使用字符的標簽

ps:()為了后面的呼叫, \1呼叫前面()里的內容,

:% s/172.16.130.1/172.16.130.5/
:% s/\(172.16.130.\)1/\15/
:% s/\(172.\)\(16.\)\(130.\)1/\1\2\35/
:3,9 s/\(.*\)/#\1/	加注釋

x\{m\} 字符x重復出現m次

[root@localhost ~]# grep o 1.txt
love
loove
looove
[root@localhost ~]# grep "o\{3\}" 1.txt
looove

x\{m,\} 字符x重復m次以上

x\{m,n} 字符出現m到n次

[root@localhost ~]# egrep "o{4,5}" 1.txt 
oooo
ooooo
ioooo
ooooi
iooooi
[root@localhost ~]# egrep "o{5,5}" 1.txt 
ooooo

2、擴展正則運算式元字符

+ 匹配1-n個前導字符

[root@localhost ~]# cat 1.txt
lve
love
loove
[root@localhost ~]# egrep lo+ve 1.txt
love
loove

? 匹配0-n個前導字符

ps:lo?ve :?前面的o 有還是沒有,都行!

[root@localhost ~]# egrep lo?ve tom.sh 
love
lve

a|b 匹配a或b

[root@localhost ~]# egrep "o|v" 1.txt 
lve
1ove
loove
looove
loeve
love
Love
iloveyou
l.ve
o
oo
ooo
oooo
ooooo
ioooo
ooooi
iooooi

() 組字符

[root@localhost ~]# egrep "loveable|rs" 1.txt 
rs
loveable
lovers
[root@localhost ~]# egrep "love(able|rs)" 1.txt 
loveable
lovers

二、grep

1、目的:過濾,查找檔案中的內容

2、分類

① grep

② egrep:擴展支持正則

\w 所有字母與數字,稱為字符[a-zA-Z0-9] 'l[a-zA-Z0-9]*ve' === 'l\w*ve'

\W 所有字母與數字之外的字符,稱為非字符 'love[^a-zA-Z0-9]+' === 'love\W+'

\b 詞邊界 '\<love\>' === '\blove\b

③ fgrep:就不支持正則

[root@localhost ~]# fgrep . 1.txt
l.ve

3、回傳值

0 就是找到了,表示成功,

1 是沒有,表示在所提供的檔案無法找到匹配的pattern(模板),

2 找到的地不對,

 ## grep 'root' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    operator:x:11:0:operator:/root:/sbin/nologin
 ## echo $?
    0
    
 ## grep 'root1' /etc/passwd  #用戶root1并不存在
 ## echo $?
    1
    
 ## grep 'root' /etc/passwd1  #這里的/etc/passwd1檔案并不存在
    grep: /etc/passwd1: No such file or directory
 ## echo $?
    2

4、引數

grep -q 靜默 (輸出的結果不在螢屏上顯示)

[root@localhost ~]# grep "5\.." 1.txt
5.1
5.2
5.a
5.b
5..
5...
5.aaa
[root@localhost ~]# grep -q "5\.." 1.txt
[root@localhost ~]# echo $?
0

grep -v 取反

grep -R 可以查目錄下面的檔案

[root@localhost ~]# grep  xulei  /home/
grep: /home/: 是一個目錄
[root@localhost ~]# grep -R  xulei  /home/
/home/xulei/.cache/gdm/session.log
/home/xulei/.cache/imsettings/log   [HOME=/home/xulei/.config/imsettings]
匹配到二進制檔案 /home/xulei/.cache/tracker/meta.db
匹配到二進制檔案 /home/xulei/.cache/tracker/meta.db-wal

grep -o 只找到這個關鍵詞就可以

[root@localhost ~]# grep "a" 1.txt
5.a
5.aaa
a
ab
abc
abcd
abcde
abcdef
loveable
ldfadasfsdave
[root@localhost ~]# grep -o  "a" 1.txt
a
a
a
a
a
a
a
a
a
a
a
a
a
a

grep -B2 前兩行

grep -A2 后兩行

grep -C2 上下兩行

egrep -l 只要檔案名

[root@localhost ~]# egrep -l 'root' /etc/passwd
/etc/passwd

egrep -n 帶行號

[root@localhost ~]# egrep -n 'xulei' /etc/passwd
43:xulei:x:1000:1000::/home/xulei:/bin/bash

示例:

grep -E 或egrep使用

egrep 'NW' datafile :在datafile檔案中,找NW

egrep 'NW' d*:找NW,檔案只要是d開頭的就可以

egrep '^n' datafile:以n開頭的行

egrep '4$' datafile:以4結尾的行

egrep TB Savage datafile:找TB,在savage里找,在datafile里找

egrep 'TB Savage' datafile:找TB Savage

egrep '5\..' datafile:找5點后面是任意一個字符

egrep '\.5' datafile:找點五

egrep '^[we]' datafile:找w或e開頭的

egrep '[^0-9]' datafile:找不是0-9的

egrep '[A-Z][A-Z] [A-Z]':找兩個大寫,一個空格,在有一個大寫的行

egrep 'ss*' datafile:找s開頭,0到多個s

egrep '[a-z]{9}' datafile:找小寫字母出現9次的

egrep '\<north' datafile:找以nourth為單詞開頭的

egrep '\<north\>' datafile:就找這個詞

egrep '\<[a-r].*n\>' datafile:a或r開頭,中間任意,n結尾

三、sed

前言:

Stream EDitor:流編輯

sed 是一種在線的、非互動式的編輯器,它一次處理一行內容,處理時,把當前處理的行存盤在臨時緩沖區中,稱為“模式空間”(pattern space),接著用sed命令處理緩沖區中的內容,處理完成后,把緩沖區的內容送往螢屏,接著處理下一行,這樣不斷重復,直到檔案末尾,檔案內容并沒有改變,除非你使用重定向存盤輸出,Sed主要用來自動編輯一個或多個檔案;簡化對檔案的反復操作;

文本檔案->“模式空間”(pattern space)->螢屏
逐行處理
內容未變

格式:

1、sed 選項 命令 檔案
sed [options] 'command' file(s)
2、sed 選項 –f 腳本 檔案
sed [options] -f scriptfile file(s)

回傳值:

都是0,不管對錯,只有當命令存在語法錯誤時,sed的退出狀態才是非0,

sed和正則運算式:與grep一樣,sed在檔案中查找模式時也可以使用正則運算式(RE)和各種元字符,正則運算式是括在斜杠間的模式,用于查找和替換,以下是sed支持的元字符,

使用基本元字符集 ^, $, ., *, [], [^], \< \>,\(\),\{\}
使用擴展元字符集 ?, +, |, ( )

使用擴展元字符的方式:

\+ 轉義
sed -r 加-r

匯總示例

編輯檔案洗掉命令 d:

[root@master1 ~]# sed -r '/root/d' passwd //匹配詞組洗掉,洗掉有root的行
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
[root@master1 ~]# sed -r '3d' passwd  //洗掉第三行
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin

洗掉第三行:

[root@master1 ~]# sed -r '3{d}' passwd
root:x:0:0:root:/root:/bin/bash 1
bin:x:1:1:bin:/bin:/sbin/nologin 2
adm:x:3:4:adm:/var/adm:/sbin/nologin 4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin 5
sync:x:5:0:sync:/sbin:/bin/sync 6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown 7
halt:x:7:0:halt:/sbin:/sbin/halt 8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin 9
operator:x:11:0:operator:/root:/sbin/nologin 10

{存放sed的多個命令} 例如:3{h;d},h暫存空間

[root@master1 ~]# sed -r '3{d;}' passwd
root:x:0:0:root:/root:/bin/bash 1
bin:x:1:1:bin:/bin:/sbin/nologin 2
adm:x:3:4:adm:/var/adm:/sbin/nologin 4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin 5
sync:x:5:0:sync:/sbin:/bin/sync 6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown 7
halt:x:7:0:halt:/sbin:/sbin/halt 8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin 9
operator:x:11:0:operator:/root:/sbin/nologin 10

洗掉3行到最后一行'3,$d'

[root@master1 ~]# sed -r '3,$d' passwd
root:x:0:0:root:/root:/bin/bash 1
bin:x:1:1:bin:/bin:/sbin/nologin 2

洗掉最后一行:

[root@master1 ~]# sed -r '$d' passwd
root:x:0:0:root:/root:/bin/bash 1
bin:x:1:1:bin:/bin:/sbin/nologin 2
daemon:x:2:2:daemon:/sbin:/sbin/nologin 3
adm:x:3:4:adm:/var/adm:/sbin/nologin 4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin 5
sync:x:5:0:sync:/sbin:/bin/sync 6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown 7
halt:x:7:0:halt:/sbin:/sbin/halt 8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin 9

替換命令 s:

[root@master1 ~]# sed -r 's/root/aofa/' passwd
aofa:x:0:0:root:/root:/bin/bash 1
bin:x:1:1:bin:/bin:/sbin/nologin 2
daemon:x:2:2:daemon:/sbin:/sbin/nologin 3
adm:x:3:4:adm:/var/adm:/sbin/nologin 4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin 5
sync:x:5:0:sync:/sbin:/bin/sync 6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown 7
halt:x:7:0:halt:/sbin:/sbin/halt 8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin 9
operator:x:11:0:operator:/aofa:/sbin/nologin 10

全域替換

[root@master1 ~]# sed -r 's/root/aofa/g' passwd  //全部的root被替換掉了  g:全域替換
aofa:x:0:0:aofa:/aofa:/bin/bash 1
bin:x:1:1:bin:/bin:/sbin/nologin 2
daemon:x:2:2:daemon:/sbin:/sbin/nologin 3
adm:x:3:4:adm:/var/adm:/sbin/nologin 4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin 5
sync:x:5:0:sync:/sbin:/bin/sync 6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown 7
halt:x:7:0:halt:/sbin:/sbin/halt 8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin 9
operator:x:11:0:operator:/aofa:/sbin/nologin 10

查找雙數 結尾的詞組
&:替換成 雙數.5
&有查詢結果的含義,

# sed -r 's/[0-9][0-9]$/&.5/' passwd 
[root@localhost ~]# sed -r 's/[0-9][0-9]$/&.5/' passwd 
root:x:0:0:root:/root:/bin/bash1
bin:x:1:1:bin:/bin:/sbin/nologin2
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10.5

sed -r 's/(mail)/E\1/g' passwd
()括號組合字符,\1呼叫括號

[root@localhost ~]# sed -r 's/(mail)/E\1/g' passwd 
Email:x:8:12:Email:/var/spool/Email:/sbin/nologin9

sed -r 's#(mail)#E\1#g' passwd
分隔符可以換成#號

讀檔案命令r:

//最后一行,讀取新檔案1.txt
[root@localhost ~]# sed -r '$r 1.txt' passwd 
root:x:0:0:root:/root:/bin/bash1
bin:x:1:1:bin:/bin:/sbin/nologin2
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10
111111111
2222222
3333333333
 sed -r '/root/r 1.txt' passwd
	//正則搜尋root,在root后面讀取新檔案

ps:在當前檔案中,讀取其他檔案的“部分”內容,

寫檔案內容:w(另存為)

sed -r 'w 111.txt' 1.txt 
//把1.txt全部內容寫入111.txt
sed -r '/root/w 123.txt' passwd //把passwd里含有root欄位的行寫到123.txt

追加命令:a(之后)

sed -r 'a123' passwd //每行后面都加上123
sed -r '2a123' passwd //第二行后面加上123

//插入段落,請使用\轉義掉回車,不要忘了分號結束
[root@localhost ~]# sed -r '2a1111\
3333333\
444444' passwd


root:x:0:0:root:/root:/bin/bash1
bin:x:1:1:bin:/bin:/sbin/nologin2
1111
3333333
444444
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10

插入命令:i(之前)

//在第二行插入新行aaaaaaaaaa

[root@localhost ~]# sed -r '2iaaaaaaaa' passwd 
root:x:0:0:root:/root:/bin/bash1
aaaaaaaa
bin:x:1:1:bin:/bin:/sbin/nologin2
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10

替換正行命令:c

//把第二行替換成aaaaaaaaa

[root@localhost ~]# sed -r '2caaaaaaaa' passwd 
root:x:0:0:root:/root:/bin/bash1
aaaaaaaa
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10

獲取下一行命令:n

//n下一行的意思,
找root行,然后下一行,洗掉

[root@localhost ~]# sed -r '/root/{n;d}' passwd 
root:x:0:0:root:/root:/bin/bash1
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10

//n:next下一行可以用多次,
[root@localhost ~]# sed -r '/root/{n;n;d}' passwd 
root:x:0:0:root:/root:/bin/bash1
bin:x:1:1:bin:/bin:/sbin/nologin2
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10

反向選擇:!

下面兩個做對比,一個沒有!,一個有!

[root@localhost ~]# sed -r '2,$d' passwd 
root:x:0:0:root:/root:/bin/bash1


[root@localhost ~]# sed -r '2,$!d' passwd 
bin:x:1:1:bin:/bin:/sbin/nologin2
daemon:x:2:2:daemon:/sbin:/sbin/nologin3
adm:x:3:4:adm:/var/adm:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10

多重編輯:e

在一個命令后加上-e后可以再跟命令

[root@localhost ~]# sed -r -e '1,3d' -e '4s/adm/admin/g' passwd 
admin:x:3:4:admin:/var/admin:/sbin/nologin4
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin5
sync:x:5:0:sync:/sbin:/bin/sync6
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown7
halt:x:7:0:halt:/sbin:/sbin/halt8
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin9
operator:x:11:0:operator:/root:/sbin/nologin10
//將一到3行洗掉,將第4行的adm全域替換成admin

暫存空間hHGgx

圖示:

暫存和取用命令,h覆寫暫存空間,H追加暫存空間,g覆寫行,G追加行,

四、AWK

awk 是一種編程語言,用于在linux/unix下對文本和資料進行處理,資料可以來自標準輸入、一個或多個檔案,或其它命令的輸出,它支持用戶自定義函式和動態正則運算式等先進功能,

awk的處理文本和資料的方式是這樣的,它逐行掃描檔案,從第一行到最后一行,尋找匹配的特定模式的行,并在這些行上進行你想要的操作,如果沒有指定處理動作,則把匹配的行顯示到標準輸出(螢屏),awk分別代表其作者姓氏的第一個字母,因為它的作者是三個人,分別是Alfred Aho、Peter Weinberger、 Kernighan,

作業原理

# awk -F: '{print $1,$3}' /etc/passwd
(1)awk使用一行作為輸入,并將這一行賦給內部變數$0,每一行也可稱為一個記錄,以換行符結束

(2)然后,行被:(默認為空格或制表符)分解成欄位(或域),每個欄位存盤在已編號的變數中,從$1開始,
最多達100個欄位

(3)awk輸出之后,將從檔案中獲取另一行,并將其存盤在$0中,覆寫原來的內容,然后將新的字串分隔
成欄位并進行處理,該程序將持續到所有行處理完畢

圖示:

內部變數

FS:輸入欄位分隔符(默認空格)

[root@slave2 ~]# df -hT
檔案系統                型別      容量  已用  可用 已用% 掛載點
devtmpfs                devtmpfs  475M     0  475M    0% /dev
tmpfs                   tmpfs     487M     0  487M    0% /dev/shm
tmpfs                   tmpfs     487M  7.6M  479M    2% /run
tmpfs                   tmpfs     487M     0  487M    0% /sys/fs/cgroup
/dev/mapper/centos-root xfs        17G  3.1G   14G   19% /
/dev/sda1               xfs      1014M  149M  866M   15% /boot
tmpfs                   tmpfs      98M     0   98M    0% /run/user/0
[root@slave2 ~]# df -hT | grep /$  |  awk '{print $5}'
14G
[root@slave2 ~]# df -hT | grep /$  |  awk '{print $5}' | awk 'BEGIN{FS='G'} {print $1}'
1
[root@slave2 ~]# df -hT | grep /$  |  awk '{print $5}' | awk 'BEGIN{FS="G"} {print $1}'
14

OFS:輸出欄位分隔符 (FS和OFS在一個{}里面)

[root@slave2 ~]# awk 'BEGIN{FS=":";OFS="++++"} {print $1,$2}' /etc/passwd  //以++++來作為分隔
root++++x
bin++++x
daemon++++x
adm++++x
lp++++x
sync++++x
shutdown++++x
halt++++x
mail++++x
operator++++x
games++++x
ftp++++x

RS:輸入記錄(行)分隔符,默認換行符

[root@slave2 ~]# awk 'BEGIN{RS="a"} {print $0}' 1.txt 
1111111111111111111
2222222222222222222
333333333333333
4444444

111111111111111111
22222222222222222222
33333333333333333333
44444444

ORS:輸出記錄(行)分隔符,默認換行符

[root@slave2 ~]# awk 'BEGIN{RS="a";ORS="============="} {print $0}' 1.txt 
1111111111111111111
2222222222222222222
333333333333333
4444444=============
111111111111111111
22222222222222222222
33333333333333333333
44444444=============
=============

FNR:多檔案獨立編號

[root@slave2 ~]# awk '{print FNR,$1}' /etc/passwd  1.txt 
1 root:x:0:0:root:/root:/bin/bash
2 bin:x:1:1:bin:/bin:/sbin/nologin
3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
4 adm:x:3:4:adm:/var/adm:/sbin/nologin
5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
6 sync:x:5:0:sync:/sbin:/bin/sync
1 1111111111111111111
2 2222222222222222222
3 333333333333333
4 4444444a
5 111111111111111111

NR:多檔案匯總編號

[root@slave2 ~]# awk '{print NR,$1}' /etc/passwd  1.txt 
1 root:x:0:0:root:/root:/bin/bash
2 bin:x:1:1:bin:/bin:/sbin/nologin
3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
4 adm:x:3:4:adm:/var/adm:/sbin/nologin
5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
6 1111111111111111111
7 2222222222222222222
8 333333333333333
9 4444444a
10 111111111111111111

NF:欄位總數

[root@localhost ~]# awk -F: '{print NF, $0}'  /etc/passwd
7 root:x:0:0:root:/root:/bin/bash
7 bin:x:1:1:bin:/bin:/sbin/nologin
7 daemon:x:2:2:daemon:/sbin:/sbin/nologin

[root@localhost ~]# awk -F: '{print NF, $NF}'  /etc/passwd
7 /bin/bash
7 /sbin/nologin
7 /sbin/nologin

格式化輸出

print函式

[root@localhost ~]# date |awk '{print "Month: " $2 "\nYear: " $1}'
Month: 11月
Year: 2017年

ps:\n換行符,想輸出文字用引號,

[root@localhost ~]# awk -F: '{print "username is: " $1 "\t uid is: " $3}' /etc/passwd | head -1
username is: root	 uid is: 0
[root@localhost ~]# awk -F: '{print "\tusername and uid: " $1,$3 "!"}' /etc/passwd  | head -1
	username and uid: root 0!

printf:

語法

%s 字符型別
%d 數值型別
%f 浮點型,可以定義保留
占15字符
- 表示左對齊,默認是右對齊
printf默認不會在行尾自動換行,加\n
, 逗號,輸出欄位分隔符

[root@slave2 ~]# awk -F: '{printf "%-10s %-10s %-15s\n",$1,$2,$3}' /etc/passwd | head
root       x          0              
bin        x          1              
daemon     x          2              
adm        x          3              
lp         x          4              
sync       x          5              
shutdown   x          6              
halt       x          7              
mail       x          8              
operator   x          11             

在每一列之間增加|,看的更加清晰,

[root@localhost ~]# awk -F: '{printf "|%-15s| %-10s| %-15s|\n", $1,$2,$3}' /etc/passwd | head
|root           | x         | 0              |
|bin            | x         | 1              |
|daemon         | x         | 2              |
|adm            | x         | 3              |
|lp             | x         | 4              |
|sync           | x         | 5              |
|shutdown       | x         | 6              |
|halt           | x         | 7              |
|mail           | x         | 8              |
|operator       | x         | 11             |

模式(正則表達)和動作

① 概念

任何awk陳述句都由模式和動作組成,模式部分決定動作陳述句何時觸發及觸發事件,如果省略模式部分,動作將時刻保持執行狀態,每一行都會有動作,模式可以是任何條件陳述句或復合陳述句或正則運算式,有模式的話,就是對模式對應的行進行動作,

模式:可以是條件測驗,正則,復合陳述句

動作:可以是列印,計算等,

②字串比較

awk '/^root/' /etc/passwd
awk '$0 ~/^root/' /etc/passwd
awk '$0!~/^root/' /etc/passwd
awk -F: '$1 ~/^root/' /etc/passwd

③ 數值比較

目的:比較運算式采用對文本進行比較,只有當條件為真,才執行指定的動作,比較運算式使用關系運算子,用于比較數字與字串,

關系運算子

語法

運算子 含義 示例
< 小于 x<y
<= 小于或等于 x<=y
== 等于 x==y
!= 不等于 x!=y
>= 大于等于 x>=y
> 大于 x>y

示例

# awk -F: '$3 == 0' /etc/passwd 
# awk -F: '$3 == 1' /etc/passwd 
# awk -F: '$3 < 10' /etc/passwd
== 也可以用于字串判斷
# awk -F: '$7 == "/bin/bash"' /etc/passwd
# awk -F: '$1 == "alice"' /etc/passwd

算數 運算

語法
+ - * / %(模) ^(冪2^3)
示例
# awk -F: '$3 * 10 > 500' /etc/passwd

④ 多條件

邏輯運算子和復合模式

語法:

&& 邏輯與 a&&b
|| 邏輯或 a||b
! 邏輯非 !a

# awk -F: '$1~/root/ && $3<=15'	 /etc/passwd
# awk -F:	 '$1~/root/ || $3<=15'		 /etc/passwd
# awk -F:	 '!($1~/root/ || $3<=15)' 	/etc/passwd

范圍模式:

awk '/從哪里/,/到哪里/' filename

# awk -F: '/adm/,/lpd/' /etc/passwd
從adm到ldp,顯示出來,注意避免匹配重復的欄位,

awk腳本編程

① 變數

awk呼叫變數

自定義內部變數 -v

awk -v user=root -F: '$1 == user' /etc/passwd
-v定義變數

外部變數 “ ‘ ”

雙引號

# var="bash"
# echo "unix script" | awk "{print "123",\"$var\"}"
123 bash
注意 awk呼叫外部變數時,外部使用雙引號,內部也使用雙引號,但需要轉義內部的雙引號

單引號

# var="bash"
# echo "unix script" |awk '{print $1,"'"$var"'"}'
unix  bash
注意使用單引號時,內部需要用雙引轉義

② 條件和判斷

if陳述句

語法:

{if(運算式){陳述句;陳述句;....}}

需求
如果$3是0,就說他是管理員

awk -F: '{if($3==0) {print $1 " is administrator."}}' /etc/passwd

if...else 陳述句

{if(運算式){陳述句;陳述句;...}else{陳述句;陳述句;...}}
{if(){}else{}}

需求

如果第三列是0,列印該行第一列,否則列印第七列,登錄shell

示例

 awk -F: '{if($3==0){print $1} else {print $7}}' /etc/passwd

需求
統計管理員和系統用戶數量
示例

awk -F: '{if($3==0){count++} else{i++}} END{print "管理員個數: "count ; print "系統用戶數: "i}' /etc/passwd

if...else if...else陳述句

格式

{if(運算式1){陳述句;陳述句;...}else if(運算式2){陳述句;陳述句;...}else if(運算式3){陳述句;陳述句;...}else{陳述句;陳述句;...}}
if (條件){動作}elseif(條件){動作}else{動作}
if(){}else if (){}else if(){}else{}

需求:

顯示出三種用戶的資訊管理員:管理員ID為0,內置用戶:用戶ID<1000,普通用戶: 用戶ID>999

[root@localhost ~]# awk -F:  '{if($3==0){print $1," is admin "}else if ($3>999){print $1," is user"}else {print $1, " is sofo user"}}'  /etc/passwd  

root  is admin 
bin  is sofo user
daemon  is sofo user
adm  is sofo user
lp  is sofo user
sync  is sofo user
shutdown  is sofo user
halt  is sofo user
mail  is sofo user

回圈

while

回圈列印10個數字

[root@slave2 ~]# awk 'BEGIN{ while(i<=10){print i;i++}}'

1
2
3
4
5
6
7
8
9
10

第一行列印十次

[root@slave2 ~]# awk -F: '{while(i<=9){print $0;i++}}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash

for

回圈列印5個數字

[root@slave2 ~]# awk 'BEGIN{for(i=1;i<=5;i++){print i}}'
1
2
3
4
5

每行列印10次

awk -F: '{ for(i=1;i<=10;i++) {print $0} }' /etc/passwd

陣列

定義陣列

將用戶名定義為陣列的值,列印第一個值,

[root@slave2 ~]# awk -F: '{username[++i]=$1}  END{print  username[1]}' /etc/passwd
root

陣列遍歷

按索引遍歷

[root@slave2 ~]# awk -F: '{username[++i]=$1}  END{for (i in username) {print i, username[i]}}' /etc/passwd  | sort -n  //sort排序
1 root
2 bin
3 daemon
4 adm
5 lp
6 sync
7 shutdown
8 halt

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/28932.html

標籤:其他

上一篇:rsync關閉命令的報錯問題及解決方法

下一篇:排障集合————DNS組態檔報錯

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more