資料挖掘，機器學習，深度學習的區別是什么？

資料挖掘通常是從現有的資料中提取規律模式以及使用演算法模型，核心目的是找到這些資料變數之間的關系，因此我們也會通過資料可視化對變數之間的關系進行呈現，用演算法模型挖掘變數之間的關聯關系，通常情況下，我們只能判斷出變數A和變數B是有關系的，但并不一定清楚這兩者之間的具體關系
機器學習是人工智能的一部分，通過訓練資料和演算法模型讓機器具有一定的智能，一般是通過已有的資料來學習知識，并通過各種演算法模型形成一定的處理能力，比如說分類，聚類，預測，推薦能力等，然后通過這些訓練好的模型對這些資料進行預測
深度學習是機器學習的一種，他的目的是讓機器具有智能，只是它是通過神經網路來實作的，神經網路就類似人的大腦，通過多次訓練之后，“大腦”就可以開始具備某種能力，這個訓練程序總，我們只需要告訴這個大腦輸入資料是什么，以及對應的輸出結果是什么即可，通過多次訓練，“大腦”中的多層神經網路的引數就會自動優化，從而得到一個適應于訓練資料的模型

所以在面對傳統的機器學習模型中，我們會更加注重模型演算法的原理，而在神經網路中我們則是更關注網路結構，以及網路結構中每層神經元的傳輸機制，我們不需要告訴機器具體的特征規律是什么，只需我們想要訓練的資料和對應的結果告訴機器大腦即可，深度學習會自己找到資料的特征規律，而傳統機器學習往往需要專家來告訴機器采用什么樣的模型演算法，

神經網路的作業原理

這里有一些重要的概念需要了解

節點：神經網路是由神經元組成的，也稱為節點，它們分布在神經網路的各個層中，這些層包括輸入層，輸出層和隱藏層
輸入層：負責接收信號，并分布到隱藏層，一般我們將資料傳給輸入層，
輸出層：負責輸出計算結果，一般來說輸出層節點數等于我們要分類的個數
隱藏層：除了輸入層和輸出層的神經網路都屬于隱藏層，隱藏層可以是一層也可以是多層，每個隱藏層都會把前一層節點傳輸出來的資料進行計算（你可以理解是某種抽象表示），這相當于是資料抽象到另一個維度的空間，可以更好的提取和計算資料的特征
作業原理：神經網路就好比一個黑盒子，我們只需要告訴這個黑盒子輸入資料和輸出資料，神經網路就可以自我訓練，一旦訓練好之后，就可以像黑盒子一樣使用，當你傳入一個新的資料時，它就會告訴你對應的輸出結果，在訓練程序中，神經網路主要是通過前向傳播和反向傳播機制運轉
- 前向傳播：資料從輸入層傳遞到輸出層的程序叫做前向傳播，這個程序的計算結果通常是通過上一層的神經元的輸出經過矩陣運算和激活函式得到的，這樣就完成了每層之間的神經元資料的傳輸
- 反向傳播：當前向傳播作用到輸出層得到分類結果之后，我們需要與實際值進行比對，從而得到誤差，反向傳播也叫做誤差反向傳播，核心原理是通過代價函式對網路中的引數進行修正，這樣更容易讓網路引數得到收斂
所以，整個神經網路訓練的程序就是不斷通過前向-反向傳播迭代完成的，當達到指定的迭代次數或者達到收斂標準的時候既可以停止訓練，然后我們就可以拿訓練好的網路模型對新的資料進行預測

常用的神經網路

神經網路分為：FNN、CNN、RNN

FNN指的是全連接神經網路，全連接的意思是每一層的神經元與上一層的所有神經元都是連接的，不過在實際使用中，全連接的引數會過多，導致計算量過大，因此在實際使用中全連接神經網路的層數一般比較少
CNN叫做卷積神經網路，在影像處理中有廣泛的應用，在CNN網路中，包括卷積層，池化層和全連接層
- 卷積層相對于有一個濾鏡的作用，它可以把影像進行分塊，對每一塊的影像進行變換操作
- 池化層相對于神經元的資料進行降維處理，這樣輸出的維數就會減少很多，從而降低整體的計算量，池化層通常在兩個卷積層之間，它的作用相當于對神經元的資料做降維處理，這樣就能降低整體計算量，假設池化的窗的大小是2 * 2，就相當于一個2 * 2的視窗對輸出資料進行計算，將原圖中2 * 2 矩陣的4個點變成一個點，常用的池化操作是平均池化和最大池化，平均池化是對特征點求平均值，也就是用4個點的平均值來做代表，最大池化則是對特征點求最大值，也就是用4個點的最大值來做代表
- 全連接層通常是輸出層的上一層，它將上一層神經元輸出的資料轉變成一維的向量，全連接的作用就是將前面一層的輸出結果與當前層的每個神經元都進行了連接，這樣就可以把前面計算出來的所有特征，通過全連接層將輸出值輸送給分類器
ＲＮＮ稱為回圈神經網路，它的特點是神經元的輸出可以在下一個時刻作用到自身，這樣ＲＮＮ就可以看做是在時間上傳遞的神經網路，它可以應用在語音識別，自然語音處理等