1、 常用的Linux命令
1)檔案操作
cat、vi、vim、ls、mkdir、touch 、cp、mv
查找是否存在該檔案名:
find / -name mysql
cat:一次性顯示檔案內容
2)日志
tail -f /var/www/MOB_logs/catalina.2018-05-18.out
抓取關鍵字:
cat catalina.2019-03-20.out | grep "回傳respData"
grep -i "回傳respData" catalina.2018-06-11.out
3)解壓
tar -zxvf filename.tar.gz
4)查找行程
ps -aux|grep java
5) 系統、記憶體、磁盤、網路相關
top 查看記憶體、cpu情況
du、df 查看磁盤、檔案大小
du -s -h /data/
ping、curl 查看網路是否正常
6)權限相關
chmod:修改檔案的權限
chown:即change owner,修改檔案和目錄的所有者權限
chattr:chmod的底層操作,鎖定檔案
2、 系統緩慢的原因,或者突然很卡
Full GC次數過多
CPU 過高
介面耗時、HTTP請求過多,回應慢,(比較經典)
死鎖(Blocke)
某個執行緒進入WAITTING,sleep、wait時間過長,假死,
CPU 過高、Full GC次數過多、記憶體使用過多、硬碟空間不足等問題,都會帶來系統突然運行緩慢的問題,也是面試特別容易被問到的,下面針對系統運行緩慢等問題進行展開,
這又引申出兩個問題:
CPU利用率和負載的問題,
CPU利用率顯示的是程式在運行期間實時占用的CPU百分比;cpu使用率反映的是當前cpu的繁忙程度,忽高忽低的原因在于占用cpu處理時間的行程可能處于io等待狀態但卻還未釋放進入wait,
CPU負載是指某段時間內占用cpu時間的行程和等待cpu時間的行程數,這里等待cpu時間的行程是指等待被喚醒的行程,不包括處于wait狀態行程,
CPU利用率高,并不意味著CPU的負載大,兩者之間沒有必然的關系,
CPU負載很高怎么辦?
可以通過 ps -axjf查看STAT這一列是否存在 D 狀態行程
比如:
[root@VM-8-8-centos proc]# ps -axjf
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
0 2 0 0 ? -1 D 0 0:00 [kthreadd]
2 4 0 0 ? -1 S< 0 0:00 \_ [kworker/0:0H]
2 6 0 0 ? -1 D 0 0:10 \_ [ksoftirqd/0]
2 7 0 0 ? -1 S 0 0:00 \_ [migration/0]
D 狀態是指不可中斷的睡眠狀態,該狀態的行程無法被 kill,也無法自行退出,只能通過恢復其依賴的資源或者重啟系統來解決,
負載高,好比節假日的高速公路堵車,馬路都是車,已經阻塞了,收費站外面還有很多車在等著,解決方法就是多建一條高速公路,提升服務器的硬體性能,或者找出I/O等待的任務,手動處理,
負載高常見的原因有:
磁盤讀寫請求過多
MySQL死鎖或者查詢回傳慢
硬碟故障,讀寫請求獲取不到資源
如果CPU很高,請看下面:
3、 線上 CPU 爆高 接近100%,怎么排查?
1)使用 `top` 命令
然后按 1 表示進入第1個CPU(如果是多核需要分別查看不同的CPU)
演示:
[root@VM-8-8-centos ~]# top
top - 23:17:16 up 7:54, 1 user, load average: 1.73, 1.70, 1.71
Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie
%Cpu(s): 50.0 us, 50.0 sy, 0.0 ni, 0.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1882056 total, 69588 free, 1255116 used, 557352 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 478816 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1953 root 20 0 101080 2248 1732 S 0.3 0.1 0:01.89 YDLive
2310 root 20 0 2369316 246988 13760 S 0.3 13.1 0:22.47 java
5082 root 20 0 154808 10500 3248 S 0.3 0.6 0:11.14 YDService
1 root 20 0 43444 3872 2580 S 0.0 0.2 0:01.27 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
4 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
5 root 20 0 0 0 0 S 0.0 0.0 0:00.07 kworker/u2:0
6 root 20 0 0 0 0 S 0.0 0.0 0:00.02 ksoftirqd/0
7 root rt 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
看到右上角:
load average: 1.73, 1.70, 1.71
— load average后面的三個數分別是1分鐘、5分鐘、15分鐘的負載情況, 指的是處于可運行狀態和不可中斷狀態的平均行程數,數字越大,CPU負載越大,
如果 小于 CPU數 * 每個CPU的核心數 , 則表示負載是合理的,比如上面我的服務器 CPU 是1個,只有1個核心,那么現在1.7的負載大于1,就很不合理了,證明有很多任務在等待中,
如何查CPU和CPU核心?
查看CPU數目:
cat /proc/cpuinfo | grep "model name"
查看CPU核心:
cat /proc/cpuinfo | grep "cpu cores"
演示:
[root@VM-8-8-centos ~]# cat /proc/cpuinfo | grep "model name"
model name : AMD EPYC 7K62 48-Core Processor
[root@VM-8-8-centos ~]# cat /proc/cpuinfo | grep "cpu cores"
cpu cores : 1
2)按下 x
按下 x,就會把CPU使用情況排序,找到CPU過高的pid,以pid 19505為例,
然后看一下這個pid的執行緒情況:
ps -mp 19505 -o THREAD,tid,time
演示:
[root@VM_0_12_centos ~]# ps -mp 19505 -o THREAD,tid,time
USER %CPU PRI SCNT WCHAN USER SYSTEM TID TIME
root 0.0 - - - - - - 04:03:21
root 0.0 19 - futex_ - - 19505 00:00:00
root 0.0 19 - futex_ - - 19507 00:00:08
root 0.0 19 - futex_ - - 19508 00:00:01
root 0.0 19 - futex_ - - 19509 00:47:56
root 0.0 19 - futex_ - - 19510 00:00:00
root 0.0 19 - futex_ - - 19511 00:00:00
root 0.0 19 - futex_ - - 19512 00:00:00
root 0.0 19 - futex_ - - 19513 00:07:45
root 0.0 19 - futex_ - - 19514 00:00:00
root 0.0 19 - futex_ - - 19515 00:00:00
root 0.0 19 - futex_ - - 19516 00:00:00
root 0.0 19 - futex_ - - 19517 00:00:00
root 0.0 19 - futex_ - - 19518 00:01:33
root 0.0 19 - futex_ - - 19519 00:01:21
root 0.0 19 - futex_ - - 19520 00:00:00
root 0.0 19 - futex_ - - 19521 02:23:05
root 0.0 19 - futex_ - - 19539 00:00:00
root 0.0 19 - futex_ - - 19540 00:00:00
root 0.0 19 - futex_ - - 19576 00:05:10
或者使用以下命令
top -Hp 19505 -d 1 -n 1
都是一樣的,
3)把tid (執行緒id )轉成 16進制
以 tid 19507 為例
printf "%x\n" tid
演示:
[root@VM_0_12_centos ~]# printf "%x\n" 19507
4c33
4)查看 tid 4c31 執行緒堆疊情況:
只查看前30行
jstack 19505 |grep tid -A 30
演示:
[root@VM_0_12_centos ~]# jstack 19505 |grep 4c33 -A 30
"DestroyJavaVM" #36 prio=5 os_prio=0 tid=0x00007fbb3800a000 nid=0x4c33 waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"http-nio-8848-Acceptor-0" #34 daemon prio=5 os_prio=0 tid=0x00007fbb3820e800 nid=0x4cb2 runnable [0x00007fbaff268000]
java.lang.Thread.State: RUNNABLE
at sun.nio.ch.ServerSocketChannelImpl.accept0(Native Method)
at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:422)
at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:250)
- locked <0x00000000f2a67c30> (a java.lang.Object)
at org.apache.tomcat.util.net.NioEndpoint.serverSocketAccept(NioEndpoint.java:448)
at org.apache.tomcat.util.net.NioEndpoint.serverSocketAccept(NioEndpoint.java:70)
at org.apache.tomcat.util.net.Acceptor.run(Acceptor.java:95)
at java.lang.Thread.run(Thread.java:748)
"http-nio-8848-ClientPoller-0" #33 daemon prio=5 os_prio=0 tid=0x00007fbb38f21000 nid=0x4cb1 runnable [0x00007fbaff369000]
java.lang.Thread.State: RUNNABLE
at sun.nio.ch.EPollArrayWrapper.epollWait(Native Method)
at sun.nio.ch.EPollArrayWrapper.poll(EPollArrayWrapper.java:269)
at sun.nio.ch.EPollSelectorImpl.doSelect(EPollSelectorImpl.java:93)
at sun.nio.ch.SelectorImpl.lockAndDoSelect(SelectorImpl.java:86)
- locked <0x00000000f2a67e60> (a sun.nio.ch.Util$3)
- locked <0x00000000f2a67e70> (a java.util.Collections$UnmodifiableSet)
- locked <0x00000000f2a67e18> (a sun.nio.ch.EPollSelectorImpl)
at sun.nio.ch.SelectorImpl.select(SelectorImpl.java:97)
at org.apache.tomcat.util.net.NioEndpoint$Poller.run(NioEndpoint.java:743)
at java.lang.Thread.run(Thread.java:748)
"http-nio-8848-exec-10" #32 daemon prio=5 os_prio=0 tid=0x00007fbb38229800 nid=0x4cb0 waiting on condition [0x00007fbaff46a000]
java.lang.Thread.State: WAITING (parking)
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000000f2a68030> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
4、 查看垃圾回收GC的情況,包括fullGC次數和耗時
1)查看
ps -aux|grep java
假如pid是19505
2)使用`jstat -gc`或者 `jstat -gcutil` 查看空間使用情況
[root@VM_0_12_centos ~]# jstat -gc 19505
S0C S1C S0U S1U EC EU OC OU MC MU CCSC CCSU YGC YGCT FGC FGCT GCT
0.0 1024.0 0.0 1024.0 72704.0 8192.0 57344.0 45449.8 73168.0 70119.8 8708.0 8169.9 214 7.855 0 0.000 7.855
[root@VM_0_12_centos ~]# jstat -gcutil 19505
S0 S1 E O M CCS YGC YGCT FGC FGCT GCT
0.00 100.00 12.68 79.26 95.83 93.82 214 7.855 0 0.000 7.855
引數決議
S0 — Heap上的 Survivor space 0 區已使用空間的百分比
S1 — Heap上的 Survivor space 1 區已使用空間的百分比
E — Heap上的 Eden space 區已使用空間的百分比
O — Heap上的 Old space 區已使用空間的百分比
P — Perm space 區已使用空間的百分比
YGC — 從應用程式啟動到采樣時發生 Young GC 的次數
YGCT– 從應用程式啟動到采樣時 Young GC 所用的時間(單位秒)
FGC — 從應用程式啟動到采樣時發生 Full GC 的次數
FGCT– 從應用程式啟動到采樣時 Full GC 所用的時間(單位秒)
GCT — 從應用程式啟動到采樣時用于垃圾回收的總時間(單位秒)
背景關系切換
頻繁背景關系,會帶來性能問題
5、查記憶體使用情況
于Linux/Unix系統記憶體占用的百分比,無須過于關心,一般大于90%都是屬于正常情況~
1)使用free查看記憶體使用情況
[root@VM_0_12_centos ~]# free -h
total used free shared buff/cache available
Mem: 1.8G 862M 69M 600K 906M 806M
Swap: 0B 0B 0B
2)釋放記憶體
先 執行 sync
[root@VM_0_12_centos ~]# sync
(描述:sync 命令運行 sync 子例程,如果必須停止系統,則運行sync 命令以確保檔案系統的完整性,sync 命令將所有未寫的系統緩沖區寫到磁盤中,包含已修改的 i-node、已延遲的塊 I/O 和讀寫映射檔案)
修改drop_caches 引數
drop_caches的詳細檔案如下:
a、To free pagecache: 清空 頁面 高速快取
echo 1 > /proc/sys/vm/drop_caches
b、To free dentries and inodes: 清空 目錄項 和 索引節點
echo 2 > /proc/sys/vm/drop_caches
c、To free pagecache, dentries and inodes: 清空以上兩項
echo 3 > /proc/sys/vm/drop_caches
我這里演示試一下執行:
echo 3 > /proc/sys/vm/drop_caches
然后再查看記憶體情況:
[root@VM_0_12_centos ~]# free -h
total used free shared buff/cache available
Mem: 1.8G 862M 904M 600K 71M 856M
Swap: 0B 0B 0B
結果:free 和 available 變大了,buff/cache 變小了,有效的釋放了buffer和cache,
6、 查硬碟使用情況
df
[root@VM_0_12_centos ~]# df -hl
Filesystem Size Used Avail Use% Mounted on
/dev/vda1 50G 14G 34G 29% /
devtmpfs 909M 0 909M 0% /dev
tmpfs 920M 0 920M 0% /dev/shm
tmpfs 920M 620K 919M 1% /run
tmpfs 920M 0 920M 0% /sys/fs/cgroup
tmpfs 184M 0 184M 0% /run/user/0
du
[root@VM_0_12_centos ~]# du -h heap
147M heap
非遞回查目錄大小,方便查看總體情況:
[root@VM_0_12_centos ~]# du -s -h /root
1.3G /root
知道目錄的占用大小,就可以進行清理了,
7、 怎么殺死行程?
一般情況下,終止一個前臺行程使用 Ctrl + C 就可以了,對于一個后臺行程就需要用 kill 命令來終止,
我們會先使用 ps、top 等命令獲得行程的 PID,然后使用 kill 命令來殺掉該行程,
例如:
ps -aux|grep java
找到 java的執行緒id
kill -9 3827
8、linux vm內核引數優化設定
1)CPU
使用 uptime查看CPU使用情況
[root@VM_0_12_centos ~]# uptime
17:03:41 up 307 days, 1:31, 3 users, load average: 0.00, 0.01, 0.05
使用vmstat查看CPU使用狀態
[root@VM_0_12_centos ~]# vmstat 2 10 #2秒列印一次,一共10次
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 131104 199740 1341608 0 0 0 0 137 301 0 0 99 0 0
0 0 0 131104 199740 1341612 0 0 0 26 162 342 0 0 99 1 0
0 0 0 131140 199740 1341612 0 0 0 0 135 301 0 0 99 0 0
0 0 0 130892 199740 1341616 0 0 0 0 188 463 1 1 99 0 0
0 0 0 130912 199740 1341620 0 0 0 68 145 284 1 0 99 0 0
解釋:
procs列
r: 運行佇列長度和正在運行的執行緒數;
b: 表示睡眠行程的數量,即阻塞的行程數;
swpd: 虛擬記憶體已使用的大小,如果大于0,表示你的機器物理記憶體不足了,如果不是程式記憶體泄露的原因,那么你該升級記憶體了或者把耗記憶體的任務遷移到其他機器;
memory列
free:空閑的物理記憶體的大小;
buff: 存盤,目錄里面的內容、權限等的快取大小;
cache: 緩沖大小,值越大,命中緩沖幾率越大,就不會經常讀寫磁盤;
swap列
si: 每秒從磁盤讀入虛擬記憶體的大小,如果這個值大于0,表示物理記憶體不夠用或者記憶體泄露了,要查找耗記憶體行程解決掉,我的機器記憶體充裕,一切正常,
so: 每秒虛擬記憶體寫入磁盤的大小,同上;
io列
bi: 塊設備每秒接收的塊數量,這里的塊設備是指系統上所有的磁盤和其他塊設備,默認塊大小是1024byte;
bo: 塊設備每秒發送的塊數量,例如我們讀取檔案,bo就要大于0,bi和bo一般都要接近0,不然就是IO過于頻繁,IO等待時間也長,需要調整;
system列
in: 每秒CPU的中斷次數,包括時間中斷;
cs: 每秒背景關系切換次數 ;
這兩個值越大,內核消耗的CPU時間會越大
CPU列
us: 用戶行程執行時間(user time),us的值比較高時,說明用戶行程消耗的CPU時間多,長期高應檢查程式
sy: 系統行程執行時間(system time),sy的值高時,說明系統內核消耗的CPU資源多,長期高因檢查系統
id: 空閑時間(包括IO等待時間),中央處理器的空閑時間 ,以百分比表示,
wa: 等待CPU的行程占用百分比
st: cpu在虛擬化環境上在其他占用的開銷,可以理解為被抽走了多少cpu資源
2) 埠
只用關心TIME_WAIT的個數,Linux下可用埠的數量只有65535個,占用一個少一個,我們可以調整Linux的TCP內核引數,讓系統更快的釋放TIME_WAIT連接,
[root@VM_0_12_centos ~]# netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
CLOSE_WAIT 1
ESTABLISHED 5
修改:
vim /etc/sysctl.conf
修改3個引數:
1) net.ipv4.tcp_syncookies = 1 表示開啟SYN Cookies,當出現SYN等待佇列溢位時,啟用cookies來處理,可防范少量SYN攻擊;默認為0,表示關閉
2) net.ipv4.tcp_tw_reuse = 1 表示開啟重用,允許將TIME-WAIT sockets重新用于新的TCP連接,默認為0,表示關閉
3) net.ipv4.tcp_tw_recycle = 1 表示開啟TCP連接中TIME-WAIT sockets的快速回收,默認為0,表示關閉
查看可用埠范圍:
[root@VM_0_12_centos ~]# cat /proc/sys/net/ipv4/ip_local_port_range
32768 60999
修改 sysctl.conf 檔案修改范圍:
net.ipv4.ip_local_port_range = 1024 65535
3)定時任務清理臨時目錄垃圾檔案,日志歸檔
4)鎖定關鍵系統檔案,防止被提權篡改
5)清除多余的系統虛擬賬號

9、如何合理查找
換句話說就是 合理使用find參命令
1)在 `/software` 目錄下找出大小超過 10MB 的檔案
find /software -type f -size +10240k
[root@VM_0_12_centos /]# find /software -type f -size +10240k
/software/mysql-5.6.33-linux-glibc2.5-x86_64.tar.gz
/software/mysql/lib/libmysqlclient.a
/software/mysql/lib/libmysqld-debug.a
/software/mysql/lib/libmysqld.a
2)目錄下找出 365 天之內未被訪問過的檔案
find /software \! -atime -365
[root@VM_0_12_centos /]# find /software \! -atime -365
/software
/software/mysql-5.7.20-linux-glibc2.12-x86_64.tar.gz
3) 目錄下找出 365 天之前被修改過的檔案
find /home -mtime +365
[root@VM-8-8-centos ~]# find /home -mtime +365
/home
/home/HaC
/home/HaC/HaC.pub
/home/HaC/HaC
10、Linux的目錄結構
常見的:
/bin:
bin 是 Binaries (二進制檔案) 的縮寫, 這個目錄存放著最經常使用的命令,
/boot:
這里存放的是啟動 Linux 時使用的一些核心檔案,包括一些連接檔案以及鏡像檔案,
/dev :
dev 是 Device(設備) 的縮寫, 該目錄下存放的是 Linux 的外部設備,在 Linux 中訪問設備的方式和訪問檔案的方式是相同的,
/etc:
etc 是 Etcetera(等等) 的縮寫,這個目錄用來存放所有的系統管理所需要的組態檔和子目錄,
/home:
用戶的主目錄,在 Linux 中,每個用戶都有一個自己的目錄,一般該目錄名是以用戶的賬號命名的,如上圖中的 alice、bob 和 eve,
/lib:
lib 是 Library(庫) 的縮寫這個目錄里存放著系統最基本的動態連接共享庫,其作用類似于 Windows 里的 DLL 檔案,幾乎所有的應用程式都需要用到這些共享庫,
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/261949.html
標籤:Linux
上一篇:VM Ubuntu系統建立兩個普通賬戶webas1和webas2,利用xshell登錄webas1后,能查看home/websa2內容,什么原因?
下一篇:STM32 輸入捕獲功能
