一個故事看懂AI神經網路作業原理-有解無憂

我是一個AI神經元

我是一個AI神經元，剛剛來到這個世界上，一切對我來說都特別新奇，

之所以叫這個名字，是因為我的作業有點像人類身體中的神經元，

人體中的神經元可以傳遞生物信號，給它輸入一個信號，它經過處理后再輸出一個信號傳遞給別的神經元，最終傳遞到大腦完成對一個信號的決策和處理，

聰明的計算機科學家們受到啟發，在代碼程式里發明了我：神經元函式，

在我們的世界里，我只是普普通通的一員，像我這樣的神經元有成百上千，甚至上萬個，我們按照層的形式，組成了一個龐大的神經網路，

很快我和隔壁工位的大白開始混熟了，他比我來得早，對這里要熟悉的多，

聽大白告訴我說，我們這個神經網路是一個影像識別的AI程式，只要給我們輸入一張狗的照片，我們就能告訴你這是一只柯基，還是泰迪、柴犬、二哈···

神經元結構

在大白的指引下，我很快就學會了怎么作業，

雖然我們叫神經元，名字聽起來挺神秘的，但實際上我就是一個普通函式，有引數，有回傳值，普通函式有的我都有：

def neuron(a):
  w = [...]
  b = ...
  ...

我有一個引數a，這個引數是一個陣列，里面的每一個元素我把它分別叫做a1，a2，a3···用這個a來模擬我這個神經元收到的一組信號，

人類的神經元是怎么處理輸入的生物信號我不知道，我估計挺復雜的，但在我這里就很簡單:我給每一個輸入值設定一定的權重，然后做一個簡單的加權求和，最后再加上一個偏移值就行啦！

所以我還有一個陣列叫做w，就是權重weight的意思，里面的每一個元素我叫做w1，w2，w3···，至于那個偏移值，就叫它bias，

如此一來我的作業你們也該猜到了，就是把傳進來的a里面的每個元素和w里的每一個元素做乘法，再加起來，最后加上偏移值，就像這樣：

說到這里，我突然想到一個問題，打算去問問大白，

“大白，這些要計算的資料都是從哪里來的呢？”

“是上一層的神經元們送過來的”

“那他們的資料又是哪來的呢？”，我刨根問題的問到，

大白帶我來到了門口，指向另外一個片區說到，“看到了嗎？那里是資料預處理部門，他們負責把輸入的圖片中的像素顏色資訊提取出來，交給我們神經網路部門來進行分析，”

“交給我們？然后呢”

“咱們這個神經網路就像一臺精密的機器，我們倆只是其中兩個零件，不同的權重值某種意義上代表了對圖片上不同位置的像素關心程度，一旦開動起來，喂給我們圖片資料，我們每一個神經元就開始忙活起來，一層層接力，把最終的結果輸出到分類器，最終識別出狗的品種，”

神經網路訓練

正聊著，突然，傳來一陣廣播提示音，大家都停止了閑聊，回到了各自工位，

“這是要干啥，這么大陣仗？”，我問大白，

“快坐下，馬上要開始訓練了”，大白說到，

“訓練？訓練什么？”

“咱們用到的那些權重值和偏移值你以為怎么來的？就是通過不斷的訓練得出來的，”

還沒說到幾句話，資料就開始送過來了，按照之前大白教給我的，我將輸入資料分別乘以各自的權重，然后相加，最后再加上偏移bias，就得到了最后的結果，整個程序很輕松，

我準備把計算結果交給下一層的神經元，

大白見狀趕緊制止了我，“等一下！你不能直接交出去”

“還要干嘛？”

大白指了一下我背后的另一個家伙說到：“那是激活函式，得先交給他處理一下”

“激活函式是干嘛的？”，我問大白，

“激活，就是根據輸入信號量的大小去激活產生對應大小的輸出信號，這是在模仿人類的神經元對神經信號的反應程度大小，好比拿一根針去刺皮膚，隨著力道的加大，身體的疼痛感會慢慢增強，差不多是一個道理，”

聽完大白的解釋，我點了點頭，好像明白了，又好像不太明白，

后來我才知道，這激活函式還有好幾種，經常會打交道的有這么幾個：

sigmoid

tanh

relu

leaky relu

激活函式處理完后，總算可以交給下一層的神經元了，我準備稍事休息一下，

剛坐下，就聽到大廳的廣播：

隨后，又來了一組新的資料，看來我是沒時間休息了，趕緊再次忙活了起來，

這一忙不要緊，一直搞了好幾個小時，來來回回重復作業了幾萬次，我都快累癱了，

損失函式 & 優化方法

趁著休息的空當，我又和大白聊了起來，

“大白，剛剛咱們這么來來回回折騰了幾萬次，這是在干啥啊？”

大白也累的上氣不接下氣，緩了緩才說到：“這叫做網路訓練，通過讓我們分析大量不同品種狗的圖片，讓我們訓練出合適的權重和偏移值，這樣，我們就變得會認識狗品種了，以后正式作業的時候給我們新的狗的圖片，咱們也能用學到的知識去分辨啦！”

“那到底是怎么訓練的，你給我說說唄”，我繼續問到，

“你剛才也看到了，廣播里不斷通知更新權重和偏移值，這訓練就是通過不斷的嘗試修改每一層神經元的權重值和偏移值，來不斷優化，找到最合適的數值，讓我們對狗的種類識別準確率最好！”，大白說到，

“不斷嘗試修改？這么多神經元，難不成看運氣瞎碰？”

大白給了我一個白眼，“怎么可能瞎試，那得試到猴年馬月去了，咱們這叫深度學習神經網路，是能夠自學習的！”

他這么一說我更疑惑了，“怎么個學習法呢？”

“其實很簡單，咱們先選一組權重偏移值，做一輪圖片識別，然后看識別結果和實際結果之間的差距有多少，把差距反饋給咱們后，再不斷調整權重和偏移，讓這個差距不斷縮小，直到差距接近于0，這樣咱們的識別準確率就越接近100%”

“額，聽上去好像很簡單，不過我還有好多問題啊，怎么去衡量這個差距呢？具體怎么調整權重偏移呢？調整幅度該多大好呢？”，我小小的腦袋一下冒出了許多的問號，

大白臉上露出了不可思議的表情，“小伙子，不錯嘛！你一下問出了神經網路的三個核心概念，”

“是哪三個？快給我說說”

大白喝了口水，頓了頓接著說到，“首先，怎么去衡量這個差距？這個活，咱們部門有個人專門干這活，他就是損失函式，他就是專門來量化咱們的輸出結果和實際結果之間的差距，量化的辦法有很多種，你空了可以去找他聊聊”

“那第二個呢？”

“第二個，具體怎么調整，這也涉及到咱們神經網路中一個核心概念，他就是優化方法，咱們部門用的最多的是一個叫梯度下降的方法，那玩意兒有點復雜，一時半會兒給你說不清楚，大概差不多就是用求導數的方式尋找如何讓損失函式的損失值變小”，大白繼續耐心的解釋著，

“好吧，那第三個核心概念是什么？”

“你剛不是問調整幅度嗎？這個調整幅度太小了不行，這樣咱們訓練的太慢了，那得多訓練很多回，太大了也不行，要是一不小心錯過了那個最優值，損失函式的結果就會來回搖擺，不能收斂，所以有一個叫學習速率的數值，通常需要程式員們憑借經驗去設定”

我還沉浸在大白的講解中，廣播聲再次響起：

看來程式員修改了學習速率，我只好打起精神，繼續去忙了，真不知道何時才能訓練達標啊～

往期TOP5文章

我是Redis，MySQL大哥被我害慘了！

CPU明明8個核，網卡為啥拼命折騰一號核？

因為一個跨域請求，我差點丟了飯碗

完了！CPU一味求快出事兒了！

哈希表哪家強？幾大編程語言吵起來了！

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/174802.html

標籤：java

上一篇：上周剛拿到美團offer的大佬怒懟我：現在的Java面試已經和2年前完全不一樣了！

下一篇：別在折騰開發環境了，一勞永逸的 Python 環境搭建方法