什么是深度學習?
簡單理解深度學習就是人類容易做的事情,機器不容易完成的事情,(實體:人臉識別,這個例子很好的證明了這句話,假如你識別一個人 ,今天這個人長這個樣子,明天臉上有一塊傷口,我們人是不是還可以一眼就可以識別,而機器卻不好識別),

深度學習模型
自然語言處理是人工智能皇冠上的明珠,
深度學習的模型
1.深度學習模型的四大部分:
資料集、模型、學習準則、優化方法
2.深度學習模型:

3.深度學習模型學習方法
基礎模型:MLP,CNN,RNN
主流模型:transformer,GPT,Bert
4.深度學習模型的學習導師:keras
Keras是一個流行的深度學習庫,2017年就有250000名研發人員共同研發,
Google的tansorflow選擇kears作為其庫的高級API
Keras是一個致力于加速深度學習模型實施的庫
Keras快速圖形化模型
keras模型流程圖:

如何構建kears構建模型:

kears模型總結:
| Layer(type) | Output Shape | Param # |
| dense_1 (Dense) | 256 | 200960(784X256+256) |
| activation_1 (Activation) | 256 | 0 |
| dropout_1 (Dropout) | 256 | 0 |
| dense_2 (Dense) | 256 | 65792(256X256+256) |
| activation_2 (Activation) | 256 | 0 |
| dropout_2 (Dropout) | 256 | 0 |
| dense_3 (Dense) | 10 | 2570(256X10+10) |
| activation_3 (Activation) | 10 | 0 |
深度學習三大模型
MLP:多層感知機(Multilayer Perceptron)
CNN:卷積神經網路(Convolutional Neural Networks)
RNN:回圈神經網路(Recurrent Neural Networks)
首先介紹MLP:
MLP是多層感知機,多層感知機是一個全連接的網路,也被稱為深度前饋網路和前饋神經網路,
MLP的流程圖:(拿數字手寫體識別舉例)


CNN:卷積神經網路



CNN模型總結:
| Layer(type) | Output Shape | Param # |
| conv2d_1 (Conv2D) | (None, 26, 26, 64) | 640 |
| max_pooling2d_1 (MaxPooling2D) | (None, 13, 13, 64) | 0 |
| conv2d_2 (Conv2D) | (None, 11, 11, 64) | 36928 |
| max_pooling2d_2 (MaxPooling2D) | (None, 5, 5, 64) | 0 |
| conv2d_3 (Conv2D) | (None, 3, 3, 64) | 36928 |
| flatten_1(Flatten) | (None, 576) | 0 |
| dropout_1 (Dropout) | (None, 576) | 0 |
| dense_1(Dense) | (None, 10) | 5770 |
| activation_1 (Activation) | (None, 10) | 0 |
RNN:回圈神經網路:

模型引數總結:
MLP:引數大約27萬
CNN:引數大約8萬
RNN:引數大約7.5萬
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/386781.html
標籤:AI
