主頁 >  其他 > Shell三劍客(grep、sed、awk)

Shell三劍客(grep、sed、awk)

2020-12-03 11:26:37 其他

Shell三劍客(grep、sed、awk)

  • 一、grep
  • 二、sed流編輯器
    • (1)sed簡介:
    • (2)作業流程:
      • - 常見選項
      • - 常見操作
      • - sed替換標記
      • - sed元字符集
    • sed用法示例
      • (1)輸出符合條件的文本
      • (2)洗掉符合條件的文本 ’d'
      • (3)替換符合條件的文本
      • (4)遷移符合條件的文本
      • (5)使用腳本編輯檔案
  • 三、awk工具
    • (1)awk作業流程
    • (2)awk常見用法
    • (3)特殊的內建變數
      • 用法示例:
        • (1)按行輸出文本
        • (2)按欄位輸出文本
        • (3)通過管道符、雙引號呼叫shell命令

一、grep

grep的一些正則運算式的鏈接,之前寫過,所以這篇就不多描述了(點擊這里跳轉)
grep命令——檢索和過濾檔案內容 (在檔案中去查找并顯示包含指定字串的行)
語法結構: grep 選項 查找條件 目標檔案
選項:
-i 查找內容時忽略大小寫
-v 條件反轉 (和所寫的條件正好完全相反)
-n 顯示行號

二、sed流編輯器

(1)sed簡介:

sed是一種流編輯器,它是文本處理中非常適中的工具,能夠完美的配合正則運算式使用,功能不同凡響,處理時,把當前處理的’行‘存盤在臨時緩沖區中,又稱為 ‘模式空間’(pattern space) ,接著使用sed命令再去處理緩沖區中的內容,處理完成后,把緩沖區的內容輸出到螢屏上,接著再去處理下一行,這樣不斷重復,知道處理到檔案的末尾,檔案內容并沒有改變(也可以加選項,去直接修改檔案,或者使用重定向指定檔案,存盤資料)
sed主要用來自動編輯一個或多個檔案,簡化對檔案的反復操作,撰寫轉換程式等

(2)作業流程:

  • 讀取——執行——顯示
  • 常見用法:
    sed [選項] ‘操作’ 引數
    sed [選項] -f scriptfile 引數
    引數就是檔案,也就是指定的待處理的文本檔案串列

- 常見選項

1. -e<script>  expression=<script>:一選項中的指定的 script來處理輸入的文本檔案
2. -f<script檔案>  file=<script檔案>:以選項中指定的script檔案來處理輸入的文本檔案
3. -h或  help:顯示幫助
4. -n或  quiet或——silent:僅顯示script處理后的結果
5. -V或  version:顯示版本資訊
6. -i  直接編輯文本檔案(加了這個選項后,你的操作會直接修改文本檔案)

- 常見操作

1. a\ 在當前行下面插入文本,
2. i\ 在當前行上面插入文本,
3. c\ 把選定的行改為新的文本,
4. d 洗掉,洗掉選擇的行,
5. D 洗掉模板塊的第一行,
6. s 替換指定字符
7. h 拷貝模板塊的內容到記憶體中的緩沖區,
8. H 追加模板塊的內容到記憶體中的緩沖區,
9. g 獲得記憶體緩沖區的內容,并替代當前模板塊中的文本,
10. G 獲得記憶體緩沖區的內容,并追加到當前模板塊文本的后面,
11. l 串列不能列印字符的清單,
12. n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令,
13. N 追加下一個輸入行到模板塊后面并在二者間嵌入一個新行,改變當前行號碼,
14. p 列印模板塊的行,
15. P(大寫) 列印模板塊的第一行,
16. q 退出Sed,
17. b lable 分支到腳本中帶有標記的地方,如果分支不存在則分支到腳本的末尾,
18. r file 從file中讀行,
19. t label if分支,從最后一行開始,條件一旦滿足或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾,
20. T label 錯誤分支,從最后一行開始,一旦發生錯誤或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾,
21. w file 寫并追加模板塊到file末尾,  
22. W file 寫并追加模板塊的第一行到file末尾,  
23. ! 表示后面的命令對所有沒有被選定的行發生作用,  
24. = 列印當前行號碼,  
25. # 把注釋擴展到下一個換行符以前, 

- sed替換標記

1. g 表示行內全面替換,  
2. p 表示列印行,  
3. w 表示把行寫入一個檔案,  
4. x 表示互換模板塊中的文本和緩沖區中的文本,  
5. y 表示把一個字符翻譯為另外的字符(但是不用于正則運算式)
6. \1 子串匹配標記
7. & 已匹配字串標記

- sed元字符集

1. ^  匹配行開始
2. $  匹配行結束
3. . 匹配一個非換行符的任意字符
4. * 匹配0個或多個字符
5. [] 匹配一個指定范圍內的字符
6. [^] 匹配一個不在指定范圍內的字符
7. \(..\) 匹配子串,保存匹配的字符
8. & 保存搜索字符用來替換其他字符
9. \< 匹配單詞的開始
10. \> 匹配單詞的結束
11. x\{m\} 重復字符x,m次
12. x\{m,\} 重復字符x,至少m次
13. x\{m,n\} 重復字符x,至少m次,不多于n次

sed用法示例

創建測驗檔案: (之后的測驗都是按這個文本來的,直接復制就行)

[root@localhost ~]# cat test.txt 
he was short and fat.
He was wearing a blue polo shirt with black pants.
The home of Football on BBC Sport online.
the tongue is boneless but it breaks bones.12!
google is the best tools for search keyword.
The year ahead will test our political establishment to the li
PI=3.141592653589793238462643383249901429
a wood cross!
Actions speak louder than words
#woood #
#woooooood #
AxyzxyzxyzxyzC
I bet this place is really spooky late at night!
Misfortunes never come alone/single.
I shouldn't have lett so tast.

(1)輸出符合條件的文本

——輸出所有內容,等同于cat test.txt
輸出所有內容
——輸出第三行
輸出第三行
——輸出第三到五行
輸出第三到五行
——輸出所有奇數行 (n 表示讀入下一行)
輸出所有奇數行
——輸出所有偶數行
輸出所有偶數行
——輸出1-5奇數行
輸出1-5的奇數行
輸出第十行至檔案末尾的偶數行
——輸出第四行至第一個包含the的行(也就是第四行開始,一直篩選到下一個包含the的行,這里是第五行就有the,所以篩選了兩行)輸出第四行至第一個包含the的行
——輸出包含the的所在行的行號(= 用來輸出行號,只顯示行號)
輸出包含the的行的行號
——輸出以PI開頭的行(^以PI開頭)
輸出以PI開頭的行
——輸出以數字結尾的行($就是以什么什么結尾)
輸出以數字結尾的行
——輸出包含單詞wood的行<單詞>表示單詞邊界(即想要篩選包含單詞的行就要使用\<wood\>這種的)
輸出包含單詞wood的行

(2)洗掉符合條件的文本 ’d’

nl ——計算檔案的行數
也就是說可以配合nl然后操作sed去洗掉指定的行數
nl顯示行數
——洗掉第三行 (因為全截圖的話就太大了,所以之后都是區域截圖,主要是知道效果即可)
洗掉第三行
——洗掉三到五行
洗掉三到五行
——洗掉包含cross的行
洗掉包含cross的行
——洗掉不包含cross的行 (!即相反的意思!d即是反向洗掉不帶cross的行)
洗掉不包含cross的行
——洗掉開頭為小寫字母的行
洗掉開頭為小寫子母的行
——洗掉以’ . ‘結尾的行('/\.$/d' ,這個d前面的/容易打成\,操作時要注意)
洗掉以'.'結尾的行
——洗掉空行
洗掉空行
——洗掉重復的空行(這個等同與cat -s test.txt,)
洗掉重復的空行

(3)替換符合條件的文本

——將每行的第一個the替換為THE
每行的第一個the替換為THE
——將每行中的第二個l替換為L
將每行的第二個l替換為L
——每行開始添加#字符(其實就是把開頭換成#)
開頭換成#
——將3-5行的所有的the替換為THE(3,5就是三到五行,后面加了g就是所有的意思)3-5行所有the換成THE

(4)遷移符合條件的文本

運算子:

  • H 復制到剪貼板;
  • g,G 將剪貼板中的資料覆寫/追加到指定行;
  • w 保存為檔案;
  • r 讀取指定檔案;
  • a 追加指定內容
    ——將包含the的行,遷移到行尾(;用于多個操作,和管道符差不多,H復制到剪貼板---d洗掉---$G追加到行尾)
    包含the的行遷移到行尾
    ——將1-5行遷移到17行后
    將一到五行遷移到17行
    ——將包含the的行另存為新檔案(w就是另存為,另存為到out.file)

在這里插入圖片描述
在這里插入圖片描述
——在包含the每行后添加檔案hostname內容(/the/r就是包含the的每行后面都加上/etc/hostname的內容,也就是讀取了指定檔案的內容)
在這里插入圖片描述
——在第3行后插入新行,內容為New (a也就是添加了指定內容)
在第三行后插入新行

(5)使用腳本編輯檔案

使用sed腳本,將多個編輯指令存放到檔案中(每一行一條編輯指令),通過 -f 的方式呼叫
——將1-5行遷移到17行后

使用sed:sed
使用腳本:
腳本
效果其實是一樣的

三、awk工具

簡介:
awk是行處理器,相比較螢屏處理的優點,在處理龐大檔案時不會出現記憶體溢位或是處理緩慢的問題,通常用來格式化文本資訊

(1)awk作業流程

#awk -F ‘:’ ‘{print $1,$3,$4}’ /etc/passwd
按這條命令來說:

  • awk命令會逐行讀取檔案的內容進行處理
  • awk以’:’為分隔符,將第1行資料格式化為7段,每段資料存入$1–$7變數中,$0存盤這1行資料,-F即是按什么字符來分割,這里寫的就是-F:,說明以:來分割
  • 一行處理完成繼續處理下一行,直到此檔案讀取結束
    執行完命令后的結果:
    結果

(2)awk常見用法

  • awk 選項 ‘模式或條件 { 編輯指令 }’ 檔案1 檔案2 …
  • awk -f 腳本檔案 檔案1 檔案2 …

(3)特殊的內建變數

$0           表示整個當前行
$1           每行第一個欄位
NF          欄位數量變數
NR          每行的記錄號,多檔案記錄遞增
FNR        與NR類似,不過多檔案記錄不遞增,每個檔案都從1開始
\t            制表符
\n           換行符
FS          BEGIN時定義分隔符
RS       輸入的記錄分隔符, 默認為換行符(即文本是按一行一行輸入)
~            匹配,與==相比不是精確比較(包括)
!~           不匹配,不精確比較
==         等于,必須全部相等,精確比較
!=           不等于,精確比較
&&      邏輯與
||             邏輯或
+            匹配時表示1個或1個以上
/[0-9][0-9]+/   兩個或兩個以上數字
/[0-9][0-9]*/    一個或一個以上數字
FILENAME 檔案名
OFS      輸出欄位分隔符, 默認也是空格,可以改為制表符等
ORS        輸出的記錄分隔符,默認為換行符,即處理結果也是一行一行輸出到螢屏
-F'[:#/]'   定義三個分隔符
{print} 類似于顯示的意思,后面可以跟$位置變數顯示相應的欄位

用法示例:

(1)按行輸出文本

——輸出1-3行內容(NR==即是指定行數)
輸出1-3行內容
這里(NR>=1)&&(NR<=3)和上面的NR==1,NR==3意思其實是一樣的
輸出一到三行內容
——輸出奇數行(%2求模運算,余數為1是奇數,0為偶數 )
奇數行
——輸出偶數行
偶數行
——統計以/bin/bash結尾的行(和grep -c "/bin/bash$"其實是一樣的,grep的更簡單一點,看個人喜好)
統計

(2)按欄位輸出文本

(這個感覺更常用一點,用法(1)的grep也能做到)
——輸出每行中以空格分割的第3個欄位(運用了位置變數與之配置,不加-F即默認是空格來分割)
輸出第三個欄位
——密碼為空的行 (我這個沒有密碼為空的用戶所以篩選不出來)
密碼為空的行
——輸出第7個欄位不是/bin/bsh也不是/sbin/nologin的行(!=就是不相同)
輸出第七欄位

(3)通過管道符、雙引號呼叫shell命令

示例1:
條件:呼叫wc -l 命令統計使用bash的用戶個數

  • 使用awk工具執行
    awk
  • 使用grep命令執行
    grep
    (效果是一樣的)

示例2:
條件:呼叫w命令,統計在線用戶數

  • 使用awk工具執行
    awk
  • 使用常規命令執行 (所得減去2就是在線用戶數量,可以先試試w這個命令,前兩行是時間日期等)
    在這里插入圖片描述
    w命令
    主要是看敲完命令后的效果,發現規律后就很好理解了,選項雖然多,但是好多也不常用,有時間的話記一下就可以,也不用全都記住,但是最起碼給一個sed這類的運算式什么的得能看懂

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/229344.html

標籤:其他

上一篇:萌新Centos7部署Django+Uwsgi+Nginx環境

下一篇:構建LAMP網站服務 第一步 編譯安裝httpd服務器

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more