HTTP協議
HTTP協議概述
HTTP是客戶端(用戶)與服務器(網站)請求應答的標準,
HTTP假定其下層協議提供可靠的傳輸.
通常HTTP客戶端發起一個請求,創建一個到服務器指定埠的TCP連接,HTTP服務器則在那個埠監聽客戶端的請求,一旦收到請求,服務器會向客戶端回傳一個狀態,比如"HTTP/1.1 200 ok",以及回傳的內容,如請求的檔案、錯誤資訊或者其他資訊,
HTTP作業原理
HTTP協議采用了請求/回應模式,客戶端發送一個請求報文,請求報文包含請求的方法、URL、協議版本、請求頭部和請求資料,服務器以一個狀態行作為回應,回應的內容包括協議的版本、成功或者錯誤代碼、服務器資訊、回應頭部和回應資料,
HTTP請求/回應步驟
-
客戶端連接到Web服務器
一個HTTP客戶端,通常是瀏覽器,與Web服務器的HTTP埠(默認為80)建立一個TCP socket連接,例如,http://www.baidu.com, -
發送HTTP請求
通過TCP socket,客戶端向Web服務器發送一個文本的請求報文,一個請求報文由請求行、請求頭部、空行和請求資料4部分組成, -
服務器接受請求并回傳HTTP回應
Web服務器決議請求,定位請求資源,服務器將資源復本寫到TCP套接字,由客戶端讀取,一個回應由狀態行、回應頭部、空行和回應資料4部分組成, -
釋放連接TCP連接
若connection 模式為close,則服務器主動關閉TCP連接,客戶端被動關閉連接,釋放TCP連接;若connection 模式為keepalive,則該連接會保持一段時間,在該時間內可以繼續接收請求; -
客戶端瀏覽器決議HTML內容
客戶端瀏覽器首先決議狀態行,查看表明請求是否成功的狀態代碼,然后決議每一個回應頭,回應頭告知以下為若干位元組的HTML檔案和檔案的字符集,客戶端瀏覽器讀取回應資料HTML,根據HTML的語法對其進行格式化,并在瀏覽器視窗中顯示,
在瀏覽器地址欄鍵入URL,按下回車之后會經歷以下流程:
- 瀏覽器向DNS服務器請求決議該URL中的域名所對應的IP地址;
- 請求IP的程序會先搜索本地快取是否加載過這些資料,依次查詢
瀏覽器快取、系統快取、路由器快取; - 都沒找到的話,就開始DNS決議程序,決議程序是的采用迭代查詢,依次按照
ISP(運營商)DNS快取、根域名服務器、頂級域名服務器、主域名服務器的順序,逐步讀取快取,直到拿到IP地址; - 決議完IP地址后,根據IP和埠號和服務器建立TCP連接;
- TCP連接建立程序就是三次握手,首先客戶端向處于監聽狀態的服務器發送代表同步的一報文資料,其中syn=1,發送完成后進入同步已發送狀態,服務器收到回應后發送SYN+ACK資料,進入同步已接受狀態;客戶端接收到回應后,再發送ACK資料進入連接已建立狀態,這時三次握手就完成了,
- 瀏覽器發出讀取檔案的http請求報文;服務器收到后發送http回應報文
- 瀏覽器接收到HTTP回應報文后,會取出主體部分,進行渲染和顯示,
HTTP請求格式(請求協議)

URL中包含:/index?a=1&b=2;路徑和引數都在這里,
HTTP回應格式

和請求和回應格式都是由請求/回應行、請求/回應頭、請求資料/回應正文三部分組成,
不同的是,請求格式中請求行是由請求方法,url,協議版本組成
而,回應行是由協議版本,狀態碼,狀態碼描述組成
常見的狀態碼
狀態碼的第一個數字代表當前回應的型別:
- 1xx訊息–請求已被服務器接收,繼續處理,
- 2xx成功–請求已成功的被服務器接收、理解并接受
- 3xx重定向–需要后續的操作才能完成這一請求
- 4xx請求錯誤–請求含有詞法錯誤或者無法被執行
- 5xx服務器錯誤–服務器在處理某個正確請求時發送錯誤
| 狀態碼 | 狀態碼英文描述 | 中文描述 |
|---|---|---|
| 100 | Continue | 繼續,客戶端繼續其請求 |
| 101 | Switch Protocals | 切換協議,服務器根據客戶端的請求切換協議, |
| 200 | OK | 請求成功一般用于GET和POST請求 |
|---|---|---|
| 201 | Create | 已創建,成功請求并創建了新的資源 |
| 202 | Accepted | 已接受,已經接收請求,但未處理完成 |
| 204 | No Content | 無內容,服務器成功處理,但未回傳內容,在未更新網頁的情況下,可確保瀏覽器繼續顯示當前檔案 |
| 205 | Reset Content | 重置內容,服務器處理成功,用戶終端(例如:瀏覽器)應重置檔案視圖,可通過此回傳碼清除瀏覽器的表單域 |
| 206 | Partial Content | 部分內容,服務器成功處理了部分GET請求 |
| 300 | Multiple Choices | 多種選擇,請求的資源可包括多個位置,相應可回傳一個資源特征與地址的串列用于瀏覽器選擇 |
|---|---|---|
| 301 | Moved Permanently | 永久移動,請求的資源已被永久的移動到新URI,回傳資訊會包括新的URI,瀏覽器會自動定向到新URI,今后任何新的請求都應使用新的URI代替 |
| 302 | Found | 臨時移動,與301類似,但資源只是臨時被移動,客戶端應繼續使用原有URI |
| 303 | See Other | 查看其它地址,與301類似,使用GET和POST請求查看 |
| 304 | Not Modified | 未修改,所請求的資源未修改,服務器回傳此狀態碼時,不會回傳任何資源,客戶端通常會快取訪問過的資源,通過提供一個頭資訊指出客戶端希望只回傳在指定日期之后修改的資源 |
| 305 | Use Proxy | 使用代理,所請求的資源必須通過代理訪問 |
| 306 | Unused | 已經被廢棄的HTTP狀態碼 |
| 400 | Bad Request | 客戶端請求的語法錯誤,服務器無法理解, |
|---|---|---|
| 401 | Unauthorized | 請求要求用戶的身份認證 |
| 402 | Payment Required | 保留,將來使用 |
| 403 | Forbidden | 服務器理解客戶端的請求,但拒絕執行該請求 |
| 404 | Not Found | 服務器無法根據客戶端的請求找到資源(網頁), |
| 405 | Method Not Allowed | 客戶端請求中的方法被禁止 |
| 406 | Not Acceptable | 服務器無法根據客戶端請求的內容特性完成請求 |
| 407 | Proxy Authentication Required | 請求要求代理的身份認證,與401類似,但請求者應當使用代理進行授權 |
| 408 | Request Time-out | 服務器等待客戶端發送的請求時間過長,超時 |
| 409 | Conflict | 服務器完成客戶端的 PUT 請求時可能回傳此代碼,服務器處理請求時發生了沖突 |
| 410 | Gone | 客戶端請求的資源已經不存在,410不同于404,如果資源以前有現在被永久洗掉了可使用410代碼,網站設計人員可通過301代碼指定資源的新位置 |
| 411 | Length Required | 服務器無法處理客戶端發送的不帶Content-Length的請求資訊 |
| 412 | Precondition Failed | 客戶端請求資訊的先決條件錯誤 |
| 413 | Request Entity Too Large | 由于請求的物體過大,服務器無法處理,因此拒絕請求,為防止客戶端的連續請求,服務器可能會關閉連接,如果只是服務器暫時無法處理,則會包含一個Retry-After的回應資訊 |
| 414 | Request-URI Too Large | 請求的URI過長(URI通常為網址),服務器無法處理 |
| 415 | Unsupported Media Type | 服務器無法處理請求附帶的媒體格式 |
| 416 | Requested range not satisfiable | 客戶端請求的范圍無效 |
| 500 | Internal Server Error | 服務器內部錯誤,無法完成請求 |
|---|---|---|
| 501 | Not Implemented | 服務器不支持請求的功能,無法完成請求 |
| 502 | Bad Gateway | 作為網關或者代理作業的服務器嘗試請求時,從遠程服務器接收到了一個無效的回應 |
| 503 | Service Unavailable | 由于超載或系統維護,服務器暫時的無法處理客戶端的請求,延時的長度可包含在服務器的Retry-After頭資訊中 |
| 504 | Gateway Time-out | 充當網關或代理的服務器,未及時從遠端服務器獲取請求 |
| 505 | HTTP Version not supported | 服務器不支持請求的HTTP協議的版本,無法完成處理 |
HTTP請求方法
HTTP/1.1協議中共定義了八種方法(也叫“動作”)來以不同方式操作指定的資源:
| GET | 發送請求來獲取服務器上的資源,請求體中不包含請求資料,請求資料放在請求行中 |
|---|---|
| HEAD | 與GET方法類似不過不要求服務器回傳回應資料,只需要回傳頭部資訊,主要用來檢查資源或超鏈接的有效性或是否可以可達、檢查網頁是否被串改或更新,獲取頭資訊等,特別適用在有限的速度和帶寬下, |
| POST | 向服務器提交資料讓服務器進行處理,請求資源放在請求資料中,這種方法可能導致建立新的資源或者對原有資源的修改 |
| PUT | 向指定資源上傳其最新內容 |
| DELETE | 請求服務器洗掉Request-URI所標識的資源 |
| CONNECT | HTTP/1.1協議中預留給能夠將連接改為管道方式的代理服務器,就是把服務器作為跳板,去訪問其他網頁然后把資料回傳回來,連接成功后,就可以正常的get、post了, |
| OPTIONS | 獲取http服務器支持的http請求方法,允許客戶端查看服務器的性能,比如ajax跨域時的預檢等, |
| TRACE | 回顯服務器收到的請求,主要用于測驗或診斷,一般禁用,防止被惡意攻擊或盜取資訊, |
GET和POST的比較
GET 和 POST 只是 HTTP 協議中兩種請求方式,而 HTTP 協議是基于 TCP/IP 的應用層協議,無論 GET 還是 POST,用的都是同一個傳輸層協議,所以在傳輸上,沒有區別,
GET
GET請求的資料會附在URL后面以?號分割URL和傳輸資料,引數之間以&相連,對于某些資料需要進行轉換,
| 陣列或者字符 | 原樣發送 |
|---|---|
| 空格 | 轉換為+ |
| 中文/其他字符 | 字串用BASE64加密,得出如:%E4%BD%A0%E5%A5%BD,其中%XX中的XX為該符號以16進制表示的ASCII, |
GET主要用于資訊獲取,并不會修改服務器資料是冪等的,
由于GET請求是附在URL后面,所以一般是具有長度限制的,但是這并不是http協議的限制,主要是由于瀏覽器和服務器共同決定的,
GET請求會被瀏覽器主動cache,而POST不會,除非手動設定,
POST
POST 表示可能修改服務器上的資源的請求,所以不是冪等的,
POST把提交的資料包放置在HTTP的包體中,
POST不會被主動cache,除非手動設定,
GET一定放URL,POST一定放BODY嗎?
這些都是約定好的并不是硬性要求,如果非要把get請求的引數放到http包體當中,post請求放到url上也可以,只要在服務器端做好支持就行,
POST方法比GET方法安全
由于GET方法直接將請求資料放到了URL上,所以相對而言POST方法更加安全些,
但是本質上http都是明文傳輸的,都容易被抓包獲取,所以這一點點安全性的區別基本上沒什么影響,
想要安全傳輸就只有加密的傳輸,也就是https,
因此只能說GET比POST更不安全,
POST 方法會產生兩個 TCP 資料包?
之前知乎上有一篇博客名為99%的人都理解錯了HTTP中GET與POST的區別引起了很大的討論,POST請求是否真的一定是發送2個TCP資料包,將HEADER和BODY分開發送的呢?
隨后的一篇博客聽說『99% 的人都理解錯了 HTTP 中 GET 與 POST 的區別』??仔細趴了一下這個問題,
首先結論是錯誤的,并不是POST一定發送兩個TCP資料包,HTTP 協議中沒有明確說明 POST 會產生兩個 TCP 資料包,并且實際測驗(Chrome)發現,POST請求的header 和 body 也沒有分開發送,因此,header 和 body 分開發送是部分瀏覽器或框架的請求方法,不屬于 post 必然行為,
Cookie
為什么要用cookie
由于http本身是無狀態保存的,即無狀態協議(stateless),http協議自身不對請求和回應之間的通信狀態進行保存,也就是說在HTTP這個 級別,協議對于發送過的請求或回應都不做持久化處理,這種設計是為了能更快的處理大量事務,確保協議的可伸縮性,但是,這種設計帶來了一個問題,比如,用戶登錄功能,登錄之后跳轉到其他界面也需要保持登錄狀態,對于這種情況,服務器端需要能分辨出這是誰發送的請求,需要保存用戶資訊,而HTTP/1.1雖然是stateless的,但是為了實作期望的功能,引入了Cookie技術來管理狀態,

什么是cookie
Cookie實際上是一段文本資訊(key-vakue格式),客戶端向服務器發起請求,如果服務器需要記錄該用戶狀態,就在response中頭部添加Set-Cookie向客戶端頒發一個Cookie,客戶端瀏覽器會把Cookie保存起來,當瀏覽器再請求該網站時,會把Cookie添加到請求頭一同提交給服務器,服務器通過檢查Cookie來辨認用戶狀態,
Cookie機制
當用戶第一次訪問并登錄一個網站時,Cookie的設定和發送會經過如下四個步驟:
- 客戶端向服務器發送請求;
- 服務器發送一個HttpResponse回應到客戶端,其中包括Set-Cookie的頭部;
- 客戶端保存Cookie,之后向服務器發送請求會包含一個Cookie頭部;
- 服務器回傳回應資料,

進行代碼測驗,看是否設定服務器頒發好Cookie后,客戶端下次請求是否帶Cookie
新建個JavaWeb工程,在其中寫個doGet方法
public void doGet(HttpServletRequest request, HttpServletResponse response) throws IOException {
response.setContentType("text/html");
Cookie cookie = new Cookie("mcrwayfun",System.currentTimeMillis()+"");
//設定生命周期
cookie.setMaxAge(Integer.MAX_VALUE);
response.addCookie(cookie);
}
可以看到,cookie已經成功的設定好了,并且Request Headers中也帶有設定好的Cookie

Cookie的屬性項
| 屬性項 | 屬性項描述 |
|---|---|
| NAME=VALUE | 保存到鍵值對,注意NAME得唯一 |
| Expires | 過期時間,在設定的某個時間點后該Cookie就會失效 |
| Domain | 生成該Cookie的域名 |
| Path | 該Cookie是在哪個路徑下生成的 |
| Secure | 如果設定了這個屬性,那么只會在SSH連接時才會傳回該Cookie |
Expires
該屬性用來設定Cookie的有效期,Cookie中的maxAge用來表示該屬性,單位為秒,Cookie中通過getMaxAge()和setMaxAge(int maxAge)來讀寫該屬性,maxAge有3種值,分別為正數,負數和0,
瀏覽器會將正數的Cookie持久化保存(寫入到檔案中),只要在有效時間以前都將有效
當maxAge為負時,表示是一個臨時Cookie,不會被持久化,僅在本瀏覽器視窗或者本視窗打開的子視窗中有效,關閉瀏覽器后該Cookie立即失效,
當maxAge為0時,表示立即洗掉Cookie
修改或洗掉Cookie
HttpServletResponse提供的Cookie操作只有一個addCookie(Cookie cookie),所以需要洗掉或修改的話只能覆寫,
值得注意的是,從客戶端讀取Cookie時,包括maxAge在內的其他屬性都是不可讀的,也不會被提交,瀏覽器提交Cookie時只會提交name和value屬性,這些不被提交的屬性主要是用于客戶端自己判斷,沒必要再提交給服務器,
Cookie的域名
Cookie是不能跨域名的,隱私安全機制禁止網站非法的獲取其他網站的Cookie,
正常情況下,同一個一級域名下的兩個二級域名也不能互動使用Cookie,比如test1.mcrwayfun.com和test2.mcrwayfun.com,因為二者的域名不完全相同,如果想要mcrwayfun.com名下的二級域名都可以使用該Cookie,需要設定Cookie的domain引數為**.mcrwayfun.com**,這樣使用test1.mcrwayfun.com和test2.mcrwayfun.com就能訪問同一個cookie
一級域名又稱為頂級域名,一般由字串+后綴組成,熟悉的一級域名有baidu.com,qq.com,com,cn,net等均是常見的后綴,
二級域名是在一級域名下衍生的,比如有個一級域名為mcrfun.com,則blog.mcrfun.com和www.mcrfun.com均是其衍生出來的二級域名,
Cookie的路徑
path屬性決定允許訪問Cookie的路徑,比如,設定為"/"表示允許所有路徑都可以使用Cookie
Cache
為什么要用Cache
當網路中存在大量用戶通過請求的方式獲取資源時,大量的請求往返于客戶端和服務器之間,使得資源的可用時間已經瀏覽器可處理他們的時間都有了延時,這種情況下,通過建立快取(cache)來重用已獲取的資源是優化前端性能的一個關鍵點,
什么是快取,快取的優點
快取就是將已經請求到的內容放到一個就近的倉庫存放起來,下次請求可以不向服務器請求,而是直接從快取倉庫里面提取,
Web快取主要有一下幾個優勢
- 減少網路延時,加快頁面回應速度,增強用戶體驗
- 減少網路帶寬的消耗
- 減輕服務器的壓力
Web快取的種類
| web快取型別 | 描述 |
|---|---|
| 資料庫快取 | 當web應用關系復雜,資料表蹭蹭蹭往上漲時,可以將查詢后的資料放到記憶體中進行快取,下次再查詢時,就直接從記憶體快取中獲取,從而提高回應速度, |
| CDN快取 | 我們發送一個web請求時,CDN會幫我們計算去哪得到這些內容的路徑短且快,這個是網站管理員部署的,所以他們也可以將大家經常訪問的內容放在CDN里,從而加快回應, |
| 代理服務器快取 | 代理服務器快取,跟瀏覽器快取性質類似,但是代理服務器快取面向的群體更廣,規模更大,它不只為一個用戶服務,一般為大量用戶提供服務,同一個副本會被重用多次,因此在減少回應時間和帶寬使用方面很有效, |
| 瀏覽器快取 | 每個瀏覽器都實作了 HTTP 快取,我們通過瀏覽器使用HTTP協議與服務器互動的時候,瀏覽器就會根據一套與服務器約定的規則進行快取作業,當我們在瀏覽器中點擊前進和后退 按鈕時,利用的便是瀏覽器的快取機制, |
http中的Cache機制

- 當新資源第一次被訪問時,回應頭攜帶了對當前資源的描述資訊
-
最后修改時間:last-modified
-
資源狀態唯一識別符號: etag
-
資源在客戶端快取過期時間:Expires
同時瀏覽器會將資源快取到Cache目錄,并保存檔案描述資訊,
- 當客戶端第二次請求資源時,會先檢查cache目錄中是否含有該資源,如果有,并且還沒到Expires設定的時間,
即檔案還沒有過期,那么此時客戶端將直接從Cache目錄中讀取檔案,而不再發送請求, - 如果資源已經過期,客戶端會發送一次http請求到服務器,同時在header攜帶上次修改的時間:
If-Modified-Since Fri, 10 Sep 2021 03:44:21 GMT
If-None-Match "8fb8b-14-4794674acdcc0"
web服務器接收到請求后,會決議header的資訊,如果該資源從上次時間到現在都沒有修改或者Etag資訊沒變化,則回傳304狀態碼(即只回傳頭部資訊,不包含具體回應資料,這是因為服務器認為請求資料未修改),
這樣,就能夠很大程度上減少網路帶寬以及提升用戶的瀏覽器體驗,
當然,如果服務器經過匹配發現檔案修改過了,就會將檔案資源回傳,并帶上新檔案狀態資訊,
基本引數
Expires:檔案在本地快取的過期時間,如果客戶端發現快取中的檔案沒有過期,則不發送請求
Cache-Control:Cache-Control指定請求和回應遵循的快取機制,
請求的快取指令包括
no-cache,no-store,max-age,max-stale,min-fresh,only-if-cached
回應訊息中的指令包括
public,private,no-cache,no-store,no-transform,must-revalidate,proxy-revalidate,max-age
| 指令 | 指令含義 |
|---|---|
| public | 回應可被任何快取區快取, |
| Private | 對于單個用戶的整個或部分回應訊息,不能被共享快取處理,這允許服務器僅僅描述當用戶的部分回應訊息,此回應訊息對于其他用戶的請求無效, |
| no-cache | 請求或回應訊息不能快取, |
| no-store | 用于防止重要的資訊被無意的發布,在請求訊息中發送將使得請求和回應訊息都不使用快取, |
| max-age | 客戶端可以接收生存期不大于指定時間(以秒為單位)的回應, |
| min-fresh | 客戶機可以接收回應時間小于當前時間加上指定時間的回應, |
| max-stale | 客戶端可以接收超出超時期間的回應訊息, 如果指定max-stale訊息的值,那么客戶端可以接收超出超時期指定值之內的回應訊息, |
參考博客
HTTP協議超級詳解
GET 和 POST 的區別
淺談HTTP中Get與Post的區別
聽說『99% 的人都理解錯了 HTTP 中 GET 與 POST 的區別』??
99%的人都理解錯了HTTP中GET與POST的區別
深入理解Cookie
深入理解HTTP Cache(HTTP Caching譯文+理解)
HTTP請求的快取(Cache)機制
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/299503.html
標籤:其他
