
1. 起源
1.1. 香農–法諾編碼(Shannon-Fano Coding)
1.1.1. 克勞德·香農
1.1.1.1. 1948年論文創建資訊理論領域的貝爾實驗室科學家
1.1.2. 麻省理工學院教授羅伯特·法諾(Robert Fano)
1.2. 霍夫曼編碼
1.2.1. 大衛·霍夫曼
1.2.1.1. 法諾的一位學生
1.2.2. 一種基礎壓縮演算法,它被廣泛用于通信和資料存盤系統
1.2.3. Huffman Coding
1.3. LZ77演算法
1.3.1. 以色列計算機科學家亞伯拉罕·倫佩爾(Abraham Lempel)
1.3.2. 雅各布·齊夫(Jacob Ziv)
1.3.3. 1977年
2. 錯誤印象
2.1. 壓縮對絕大多數人沒有影響
2.2. 事實
2.2.1. 幾乎所有軟體都是以壓縮格式被下載的
2.2.1.1. 這意味著下載和轉移檔案的速度要比不壓縮時快數倍
2.2.2. 你對著電話講話時,你的聲音也經過了壓縮
3. 糾錯碼和壓縮演算法是同一枚硬幣的兩面
3.1. 來自冗余的想法
3.1.1. 如果一個檔案有冗余,它就比必要的長度長
3.2. 糾錯碼能被視為向訊息或檔案中添加冗余的原則性方法
3.3. 壓縮演算法正好相反:它們會從訊息或檔案中移除冗余
3.3.1. 基本思想是發現資料中彼此相同的部分,并運用某種把戲更高效地描述這些部分
3.4. 好的壓縮演算法會移除低效冗余,而糾錯編碼會增加另一種更高效的冗余
3.5. 首先壓縮一條資訊,再往里面添加一些糾錯碼的做法非常常見
4. 無損壓縮
4.1. 終極免費午餐
4.2. 無損壓縮演算法并不能為所有檔案節省大量空間
4.3. 一種好的壓縮演算法能為特定大類的檔案節省大量空間
5. 計算機中的資料壓縮
6. 行程長度編碼
6.1. Run-length Encoding
6.2. 將重復的“行程”和行程的“長度”編碼在了一起
6.2.1. ABABAB
6.2.2. 3AB
6.3. 只在壓縮非常特殊的資料種類上有用
6.4. 大部分時候只是和其他壓縮演算法結合起來使用
6.5. 傳真機就將行程長度編碼和另一種被稱為霍夫曼編碼的技術結合
6.6. 傳真是黑白檔案,檔案會被轉換成許多點,每個點都是非黑即白,當你按順序閱讀這些點(從左到右,從上到下)時,你會遇到大段白點(背景)以及小段黑點(前景文本或筆跡),這讓使用行程長度編碼變得非常有效
7. 同前把戲
7.1. Same-as-earlier Trick
7.2. 往回數27個字母,然后復制從那一點開始往下的8個字母
7.2.1. back 27,copy 8
7.2.1.1. b27c8
7.3. FG-FG-FG-FG-FG-FG-FG-FG
7.3.1. FG-FG-FG-FG-b8c8
7.3.2. back 2,copy14
7.3.2.1. 數回2個字母,直至抄到第14個字母
7.3.2.2. b2c14
7.3.2.3. FG-b2c14
7.4. Ab1c250
7.4.1. 251個A
8. 更短符號把戲
8.1. Shorter-symbol Trick
8.2. 如果你使用某樣東西足夠多次,給它起個簡短縮寫名是很值得的
8.2.1. United States of America
8.2.2. USA
8.3. 兩個常用字母的代碼被縮短了,代價是用更大的數字增長了不常用符號的代碼
8.3.1. 結果是大部分訊息的總長度都有所縮短
9. 實施步驟
9.1. 計算機使用同前把戲傳輸未經壓縮的原檔案,讓檔案中絕大多數重復資料由短得多的指令取代,這些指令會回傳并拷貝其他地方的資料
9.2. 計算機會檢查傳輸后的檔案,選出經常出現的符號,
9.2.1. 用短數字碼代表經常用到的符號,用更長的數字碼代表極少用到的符號
10. 有損壓縮
10.1. 簡單且有效的方法是直接“拋棄”一些資料
10.1.1. 會導致解壓后的原始檔案發生一些小改變
10.2. 拋棄對成品影響很小的資訊
10.3. 壓縮缺陷
10.3.1. Compression Artifact
10.3.2. 不僅僅是細節的損失,而且有損壓縮的某種方法會在接下來的解壓中引入明顯的新特征
11. 拋棄把戲
11.1. Leave-it-out Trick
11.2. JPEG影像壓縮格式
11.2.1. 整張圖片劃分為8像素×8像素的小方塊
11.2.1.1. 每個方塊都會被單獨壓縮
11.2.2. 如果方塊恰好只有一種顏色,整個方塊就能由一個數字代表,而計算機就能“拋棄”63個數字
11.2.3. 如果方塊的大部分是由一種顏色組成的,只有少數像素的顏色略有不同(也許一片天空的灰度都相同),計算機也可以用單個數字代表方塊,讓方塊得到好的壓縮結果,并在稍后解壓時只出現少量錯誤
11.2.4. 如果8×8方塊從一種顏色漸變為另一種顏色(比如左邊是深灰色,右邊是淺灰色),那么64個數字也許能被壓縮到只有2個:一個深灰的值和一個淺灰的值
11.3. 音頻壓縮格式
11.3.1. 音頻也會被劃分成“塊”,每個“塊”都會被單獨壓縮
11.3.2. 能利用與人耳有關的已知事實
11.3.2.1. 有些種類的聲音對人只有很小的影響或沒有影響
11.3.2.2. 壓縮演算法能在不降低輸出質量的情況下消除這些聲音
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/554096.html
標籤:其他
上一篇:windows 以太坊開發框架Truffle環境搭建
下一篇:返回列表
