多媒體資訊特點:
- 資料量大
- 連續性
- 資料編碼方式多樣
多媒體關鍵技術:
- 多媒體同步技術(研究視頻資料和聲音資料在時間上的協調)
- 多媒體壓縮技術
- 大容量存盤技術
- 多媒體編碼技術
- ……
影像數字化程序:
- 采樣:解析度M??N
- 量化(二位1色(二值圖)/灰度8位(灰度圖)/真彩色24位(彩色圖))
量化位數(像素深度):存盤每個像素所使用的二進制的位數
- 編碼
影像型別:
- 分為三類:數字影像(位圖)、矢量圖、紅外影像
- 矢量圖與位圖的區別:矢量圖占用的存盤空間小,保存的是描述圖形的指令(位圖保存的是像素顏色資訊),不受解析度的影響(不失真),但顯示速度慢
- 紅外影像特點:有較大的作用距離和較強的抗干擾能力,夜間可以保持作業,但像素解析度低,邊緣模糊、溫度區間界限不明顯,檔案格式特殊、不通用
常見影像檔案格式:
- GIF格式:最多只有256種顏色
- PNG格式:背景可以是透明或者半透明的
- JPEG格式:有損壓縮格式
- BMP格式:通常不壓縮,體積大
- TIFF格式:在各種地理資訊系統、遙感領域廣泛應用
各種顏色模型:
- RGB顏色:
-
- 三種基本顏色等量相加為白色;紅綠等量相加而藍色為0為黃色;紅藍等量相加而綠色為0時為品紅色;綠藍等量相加紅為0為青色
- R、G、B各占用8bit
-
- HSL顏色模型:
三個基本要素:色調、飽和度、亮度
- CMKY顏色模型
常用于印刷行業的顏色空間
- YUV顏色模型
Photoshop 8.0.1不支持
聲音編碼三步驟:
- 采樣:將聲音信號在時間上離散化
采樣頻率越高,聲音質量越好
- 量化:將聲音信號在幅度上離散化,將某個范圍內的振幅用一個確定的值來表示
均勻量化意味著所有輸入信號采用統一量化間隔,量化位數越高,聲音質量越好
- 編碼:采樣點落在兩個相鄰幅度之間時,按就近原則選擇采樣點幅度等級;若恰好落在相鄰幅度之間,則取高等級
聲音分析:
- 時域分析:
步驟:語音分幀、定量分析(語音信號具有典型的時域特征,短時能量、短時平均能量、短時平均過零率等)
意義:實作語音的分割、分類
- 頻域分析(傅立葉變換):
概念:從頻率域上提取資訊的頻率特性
意義:分析信號的頻率構成、發現主要成分
- 語譜圖:將時域、頻域特征共同呈現,橫軸表示時間、縱軸表示頻率,每個點的灰度值大小反映相應時刻和相應頻率的能量,點越高表示能量越高
計算題!!!
- 一幅解析度為1065??1065的真彩色影像所占用的存盤空間:
(1065??1065??3B)/(1024??1024)=3.22MB
這里要注意換算單位
- 聲頻位元率(bps)=采樣率(Hz)??量化位數(bit)??聲道數
音頻檔案大小(Byte)=位元率(bps)??時長(s)/8
- 視頻流碼率(bps)=幀率(fps)??解析度??量化位數(bit)
視頻檔案總碼率=視頻流碼率+音頻流碼率
視頻檔案大小(Byte)=碼率(bps)??視頻時長(s)/8
常見語音編碼技術:
- WAV格式:保存沒有壓縮的音頻,即使用PCM編碼的音頻,也稱為波形檔案
- CDA格式(CD):只包含了音頻資料的索引資訊,無法直接在計算機中播放,與WAV格式的聲音檔案質量相同
- MP3格式:音頻壓縮技術,音質有較小損失,犧牲了檔案中12KHz~16KHz高頻部分質量
- MID格式:存盤聲音的指令
數字視頻的優點:
抗干擾能力強、可以不失真的進行多次復制和長距離傳輸、使用視頻編輯軟體進行編輯處理和合成(可進行非線性編輯)、可以長時間存盤、易于實作資源共享
幾個瑣碎的知識點:
- 影響影像質量的因素:
影像解析度、量化位數、像素深度
- 影響聲音質量的因素:
采樣頻率、量化位數、聲道數
資料編碼:
- 游程長度編碼(無損壓縮)
采用“相同的像素點個數(設為a)+相同的像素的像素值(設為b)”的方式記錄影像資訊
影像中色塊區域越大,資料的相關性越強,則壓縮比越大
灰度圖一個游程長度2個位元組(a+b),真彩圖一個游程長度4個位元組(數字不變,色彩變為3個位元組,相加可得),灰度圖原來的編碼長度直接為長乘寬,真彩圖原來的長度為長乘寬乘3(每個像素對應3個位元組)
- 哈夫曼編碼(無損壓縮)
出現越多的字符分配越少的編碼,是得最終的平均碼長最短
編碼不唯一、譯碼唯一(唯一前綴)
符號出現次數越不平均,壓縮效果越好
可變字長編碼
樹中大的那邊是0
壓縮后字串編碼長度為次數乘編碼長度的加和,而原來未壓縮時乘2
人工智能:
- 發展:
- 弱人工智能:擅長于單個方面
- 強人工智能:在各方面與人類比肩
- 超人工智能:幾乎所有方面都比人類聰明
- 關于學習的分類
- 機器學習
- 深度學習:特征提取、訓練、識別
- 強化學習
自主探索磁性套索、魔棒、自由套索、橢圓選框、色階工具、仿制圖章
Ps中按住alt拖動圖層實作復制、按住control實作拖動
壓縮比為原始:壓縮后的
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/401493.html
標籤:其他
上一篇:LeetCode - 390 -消除游戲 - Java - 細喔
下一篇:基于深度學習的目標檢測
