主頁 >
其他 > 讀資料壓縮入門筆記01_資料壓縮導讀
讀資料壓縮入門筆記01_資料壓縮導讀
2023-05-29 08:12:35 其他

1. 建立在資料壓縮上的世界
1.1. 資料壓縮技術最讓人驚異之處在于,它與過去40年里個人計算的很多重大改變有關,但很少有人知道這一點
1.2. 我們當下生活在其中的這個計算世界,完全建立在資料壓縮演算法之上
1.3. 影像的壓縮
1.3.1. 1978年
1.3.2. 影像語料庫
1.3.2.1. 1972年11月《花花公子》雜志中萊娜?瑟德貝里(Lena S?derberg)
1.4. 音樂的壓縮
1.4.1. 1996年
1.4.2. WAV
1.4.2.1. MP3
1.4.2.1.1. Napster音樂共享平臺
1.4.2.1.2. iPod
1.4.2.1.2.1. iTunes
1.4.2.1.2.2. iPhone
1.5. 視頻的壓縮
1.5.1. 2001年
1.5.2. YouTube
1.5.2.1. MOV
1.6. 基因圖譜
1.6.1. 2008年
1.6.2. 單個基因組序列就包含了大量的資料,僅僅是描述人類基因組成的資料就超過了14GB
1.6.3. BWT是最有效的存盤DNA資訊的壓縮格式,甚至無須解壓就能對資料進行操作
1.7. 壓縮與經濟
1.7.1. 壓縮后的檔案會變得更小
1.7.1.1. 同樣的資料傳輸所需的時間會變短,相應的費用也會減少
1.7.1.2. 分發者的分發成本會降低,消費者的支出也會減少
2. 克勞德?香農
2.1. 碩士論文題為《繼電器與開關電路的符號分析》
2.1.1. 為基于開關的現代電路計算奠定了基礎
2.2. 1948年發表了《通信的數學理論》
2.2.1. 論述了發送者怎樣對要發送的資訊進行編碼才能達到最佳效果
2.3. 發明了一種度量訊息所攜帶資訊內容的方法
3. 什么是資料壓縮
3.1. 用最緊湊的方式來表示資料
3.2. “在保證資訊能恢復的前提下,我們能將訊息變得多么緊湊”
3.3. 根據現代資訊論的觀點,在壓縮資料以減少總二進制位數的時候存在一個臨界點,如果超過了這個值,我們就不能將壓縮后的資料唯一正確地恢復為原來的資料流,
3.3.1. 我們的壓縮目標就是盡可能地減少總二進制位數以接近這個臨界值,并且不超過這個值
4. 訊息編碼方式
4.1. 對每一個特定的訊息來說,都有一個最佳的編碼方式,這里的“最佳”指的是傳遞訊息時用到的字母或者符號(也可以說是二進制位,即資訊的單位)最少
4.2. “字母表”與“摩爾斯碼”是其中常見的兩種
5. 資料壓縮思路
5.1. 減少資料中不同符號的數量
5.1.1. 即讓“字母表”盡可能小
5.2. 用更少的位數對更常見的符號進行編碼
5.2.1. 即最常見的“字母”所用的位數最少
6. 資料壓縮考慮因素
6.1. 不同資料的處理方法不同
6.1.1. 壓縮一本書中的文字和壓縮浮點型的數
6.2. 有些資料必須經過轉換才能變得更容易壓縮
6.3. 資料可能是偏態的
6.3.1. 夏天的整體氣溫偏高
6.3.1.1. 高氣溫出現的頻率比接近零度的氣溫出現的頻率高很多
7. 資料壓縮演算法
7.1. 變長編碼(variable-length codes,VLC)
7.2. 統計壓縮(statistical compression)
7.3. 字典編碼(dictionary encodings)
7.4. 背景關系模型(context modeling)
7.5. 多背景關系模型(multicontext modeling)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/553654.html
標籤:其他
上一篇:第30次CCF計算機軟體能力認證
下一篇:返回列表
-
- 標籤雲
-
-
- 熱門瀏覽
-
-
網閘典型架構簡述
網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......
uj5u.com 2020-09-10 02:00:44 more
-
如何從xshell上傳檔案到centos linux虛擬機里
如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......
uj5u.com 2020-09-10 02:00:47 more
-
一、SQLMAP入門
一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......
uj5u.com 2020-09-10 02:00:50 more
-
Metasploit 簡單使用教程
metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......
uj5u.com 2020-09-10 02:00:53 more
-
游戲逆向之驅動層與用戶層通訊
驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......
uj5u.com 2020-09-10 02:00:56 more
-
北斗電力時鐘(北斗授時服務器)讓網路資料更精準
北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......
uj5u.com 2020-09-10 02:01:03 more
-
【CTF】CTFHub 技能樹 彩蛋 writeup
?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......
uj5u.com 2020-09-10 02:04:05 more
-
02windows基礎操作
我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......
uj5u.com 2020-09-10 02:04:18 more
-
03.Linux基礎操作
我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......
uj5u.com 2020-09-10 02:04:30 more
-
05HTML
01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......
uj5u.com 2020-09-10 02:04:36 more
-
- 最新发布
-
-
讀資料壓縮入門筆記01_資料壓縮導讀
 # 1. 建立在資料壓縮上的世界 ## 1.1. 資料壓縮技術最讓人驚異之處在于,它與過去40年里個人計算的很多重 ......
uj5u.com 2023-05-29 08:12:35 more
-
第30次CCF計算機軟體能力認證
> 100+100+100+80+100=480 ## [重復局面](http://118.190.20.162/view.page?gpid=T170) ### 題目大意 依次給定$n$個國際象棋局面,依次回答每個局面是第幾次出現。 ### 解題思路 拿`map`記錄下每個局面,統計計數即可。 神 ......
uj5u.com 2023-05-29 08:12:29 more
-
「雜題亂寫」ABC 293 ~ ABC 295
# 「雜題亂寫」ABC 293 ~ ABC 295 點擊查看目錄 > [TOC] 這個 ABC 系列大概會持續下去,每三場寫一份。 每三場寫一份的一個重要原因是標簽上限十個。 因為是 ABC 所以不做 A 題 B 題和 C 題。 ## ABC 293 函式即所謂能帶。(k為波矢量)。不過,能帶也常常指的是在某些能量范圍內密集的能級。能帶理論是固體物理學最重要的內容之一,這里僅摘其要略加概括,因為它也是認識半導體物理性質的基礎。 一、導體、半導體、絕緣體的能帶 固體按其導 ......
uj5u.com 2023-05-29 08:11:40 more
-
Tengine 入門實戰(1)--簡介及安裝
1、簡介 Tengine 是由淘寶網發起的 Web 服務器專案。它在 Nginx 的基礎上,針對大訪問量網站的需求,添加了很多高級功能和特性。Tengine 的性能和穩定性已經在大型的網站如淘寶網,天貓商城等得到了很好的檢驗。它的最終目標是打造一個高效、穩定、安全、易用的 Web 平臺。 Tengi ......
uj5u.com 2023-05-29 08:11:25 more
-
命題邏輯那些事 | 2. 主析(合)取范式
#### 一、必要概念 ##### ***簡單X取式*** 簡單析取式、簡單合取式,說白了就是不知道這個**簡單**是個啥? **簡單**就是**有限** 你可以說是公式的**長度**有限,或者公式包含的命題變項有限,反正就是有限 當然,還**都**得是析(合)取聯結詞 這個概念有啥用嗎?大抵是** ......
uj5u.com 2023-05-29 08:05:58 more
-
📍 Pinpoint 01
原文地址:https://www.cnblogs.com/bornToBeWeird 點擊原文地址閱讀,支持作者~ 本欄目形式上效仿了[科技愛好者周刊](https://www.ruanyifeng.com/blog) 和 [阿飯的寶藏](https://xiaobot.net/p/afanfan ......
uj5u.com 2023-05-29 08:00:11 more
-
你正在錯誤使用ChatGPT!怎么樣使用能超過99%的ChatGPT使用者
[toc] 我們大多數人錯誤使用了ChatGPT。 在提示資訊中,我們不使用例子。 我們忽略的資訊是我們可以通過角色(扮演)控制ChatGPT的行為。 我們讓ChatGPT猜測(提供)材料,而不是提供給它一些資訊。 這些情況發生是因為我們大多數是使用標準的提示,這些標準的提示能幫助我們一下就能完成工 ......
uj5u.com 2023-05-29 07:54:55 more
-
千乎萬喚始出來,支持gpt3和gpt4支持畫圖,的在線gpt應用接入案例開
了解OPEN AI 平臺用戶一直在說,這個介面要怎么對接,如何在體驗。 由于我一直忙于介面中臺開發,所以在線基于OPEN AI 介面實體例子就一直沒有寫。現在終于寫完了。 基于純**HTML+CSS+JS** 小白也能輕松上手部署。代碼簡單清晰。 這里不多做其他贅述,更多關于平臺資訊如下 [小白暢玩 ......
uj5u.com 2023-05-29 07:49:21 more
-
1.4. 運算子與運算式
在 Java 中,運算子是用于執行特定操作的符號,而運算式是由變數、常量和運算子組成的一段代碼,用于計算值。本節將介紹 Java 中的常用運算子和運算式的使用。 #### 1.4.1. 算術運算子 Java 支持以下算術運算子: - 加法(`+`) - 減法(`-`) - 乘法(`*`) - 除法( ......
uj5u.com 2023-05-29 07:48:32 more
- 友情鏈接
-
-