1. 人工智能研究人員在過去幾十年中學到的最重要的教訓之一

1.1. 看似智能的行為有可能從看似隨機的系統中浮現出來

1.2. 如果我們有能力進入人腦，研究神經元之間連接的強度，其中絕大部分連接都會表現得很隨機

1.3. 當作為集合體行動時，這些連接強度的松散集合產生了人的智能行為

2. 圖形識別是人類具有天然優勢的一個領域

3. 圖形識別是人工智能（AI）的一部分

3.1. 圖形識別處理高度變化的輸入資料，如音頻、照片和視頻

3.2. 好的圖形識別系統需要巨大的人力，但這是一次性投入，并能產生長期回報

3.3. 檢驗一種圖形識別演算法在哪些情況下會失效總是很吸引人

3.4. AI處理的任務更多元

3.5. 任務的逐漸轉變——從明顯是直覺性的任務到顯然是機械化的任務——還在繼續

3.6. 普遍意義上以及圖形識別中特殊意義上的人工智能正慢慢擴展它們的邊界，提升它們的效能

3.7. 比如

4. 最近鄰分類器

4.1. 標準做法是將圖形識別看作分類問題

4.2. 讓計算機自動“學習”如何分類樣本

4.3. 點與點之間的地理距離，就能得出相距最近的點

4.4. 示例

4.5. K個最近鄰

4.6. 手寫數字

4.7. 最近鄰分類器的特殊屬性：它們無須任何詳盡的學習階段

4.8. 在學習階段無須費力

5. 決策樹

5.1. 基本上就是一個提前計劃的20個問題游戲

5.2. 示例：網路垃圾

5.3. 如果你有足夠多的訓練資料，系統可能會向一棵能進行精確分類的“決策樹”學習

5.4. “決策樹”分類器學習階段的任務量非常龐大

5.5. 學習程序可以很復雜，但它是全自動的，而且你只需要做一次

6. 神經網路

6.1. 人工神經網路領域（Artificial Neural Networks），簡稱“神經網路”

6.2. 其學習階段不僅重要，而且直接受到人類和其他動物從環境中學習的方法的啟發

6.3. 英國科學家阿蘭·圖靈（Alan Turing）

6.4. 當給予相同的輸入時，“決策樹”和神經網路產生了相同的結果

6.5. 示例：帶傘問題

6.6. 示例：判斷人臉上是否帶太陽鏡

讀改變未來的九大演算法筆記06_圖形識別

1. 人工智能研究人員在過去幾十年中學到的最重要的教訓之一

1.1. 看似智能的行為有可能從看似隨機的系統中浮現出來

1.2. 如果我們有能力進入人腦，研究神經元之間連接的強度，其中絕大部分連接都會表現得很隨機

1.3. 當作為集合體行動時，這些連接強度的松散集合產生了人的智能行為

2. 圖形識別是人類具有天然優勢的一個領域

3. 圖形識別是人工智能（AI）的一部分

3.1. 圖形識別處理高度變化的輸入資料，如音頻、照片和視頻

3.1.1. 面部識別

3.1.2. 物體識別

3.1.3. 語音識別

3.1.4. 筆跡識別

3.2. 好的圖形識別系統需要巨大的人力，但這是一次性投入，并能產生長期回報

3.3. 檢驗一種圖形識別演算法在哪些情況下會失效總是很吸引人

3.4. AI處理的任務更多元

3.4.1. 計算機國際象棋

3.4.2. 在線聊天機器人

3.4.3. 人形機器人

3.5. 任務的逐漸轉變——從明顯是直覺性的任務到顯然是機械化的任務——還在繼續

3.6. 普遍意義上以及圖形識別中特殊意義上的人工智能正慢慢擴展它們的邊界，提升它們的效能

3.7. 比如

3.7.1. 一份復雜的檢驗結果中幫助診斷病人疾病

3.7.2. 在自動收費亭識別汽車牌照

3.7.3. 向某個計算機用戶展示什么廣告

4. 最近鄰分類器

4.1. 標準做法是將圖形識別看作分類問題

4.2. 讓計算機自動“學習”如何分類樣本

4.2.1. 基本策略是給計算機標記大量資料（Labeled Data）：已經被分類的樣本

4.2.2. 每個樣本都帶有一個標簽（也就是它的類），計算機能運用多種分析把戲提取每個類的特性

4.2.3. 之后再向計算機提供一個未標記的樣本，通過選擇和未標記樣本特性最接近的樣本，計算機能推測未標記樣本的類

4.3. 點與點之間的地理距離，就能得出相距最近的點

4.4. 示例

4.4.1. 根據一個人的家庭住址，預測那個人會向哪個政治黨派捐贈嗎

4.4.2.

4.4.2.1. 右上角的？選擇D，左下角的？選擇R

4.4.2.2. 每個問號都被歸為其最相鄰物件所屬的類

4.5. K個最近鄰

4.5.1. K Nearest-neighbors

4.5.2. K代表3或5這樣的小數字

4.5.3.

4.5.3.1. 左上角的？

4.5.3.1.1. 當只使用單個最近鄰時，問號被歸為“R”

4.5.3.1.2. 當使用三個最近鄰時，問號被歸為“D”

4.6. 手寫數字

4.6.1. 人類也沒有這種內置知識

4.6.1.1. 通過結合其他人的詳盡教授以及觀看我們用來教授自己的例子，我們學會了如何去識別數字及其他手寫符號

4.6.2. 計算機并沒有內建手寫數字是什么樣的知識

4.6.2.1. 這兩種策略（詳盡教授和從例子中學習）也被用于計算機圖形識別

4.6.3. 計算兩個不同手寫數字示例之間的“距離”

4.6.3.1. 衡量數字影像之間的區別度，而非它們之間的地理距離

4.6.4. 區別度以百分比形式衡量

4.6.4.1. 區別度只有1%的影像是非常相近的鄰

4.6.4.2. 區別度在99%的影像則相差很遠

4.6.5.

4.6.5.1. 在每一行，都要用第一張圖減去第二張圖，并得出右邊的新影像，新影像中突出了這兩張圖中的區別

4.6.5.2. 區分度影像中突出部分所占的百分比，就能被視為原始影像之間的“距離”

4.6.5.3. 使用這種“最近鄰”距離方法的系統效果相當好，精確度接近97%

4.6.6. 運用最先進的距離衡量法，最近鄰分類器在手寫數字上的精確度能超過99.5%

4.6.6.1. 這一精確度能和復雜得多的圖形識別系統相比

4.6.6.2. 支持向量機（Support Vector Machine）

4.6.6.3. 回旋神經網路（Convolutional Neural Network）

4.7. 最近鄰分類器的特殊屬性：它們無須任何詳盡的學習階段

4.7.1. 直接使用最近鄰把戲跳到了分類階段

4.8. 在學習階段無須費力

4.8.1. 但分類階段要求我們將需要分類的每個東西和所有訓練示例進行比對

5. 決策樹

5.1. 基本上就是一個提前計劃的20個問題游戲

5.1.1. 從“決策樹”頂部開始，按照問題的答案一路往下即可

5.1.2. 當你到達“決策樹”底部的一個框時，你也就得到了最終結果

5.2. 示例：網路垃圾

5.2.1.

5.2.2. 網路垃圾制造者喜歡在頁面中加入大量流行詞以提升他們網頁的排名，因此流行詞占比較小，也預示該網頁是垃圾的概率較低

5.2.3. “訓練”頁面被真人分為“垃圾”或“非垃圾”

5.2.4. 整棵“決策樹”是由計算機程式基于約1.7萬個網頁上的訓練資料自動生成的

5.3. 如果你有足夠多的訓練資料，系統可能會向一棵能進行精確分類的“決策樹”學習

5.4. “決策樹”分類器學習階段的任務量非常龐大

5.4.1. 計算機測驗大量可能出現的第一個問題，尋找一個能得出最佳可能資訊的問題

5.4.2. 計算機將訓練樣本分為兩組，這取決于樣本對第一個問題的答案，并產生第二個對這兩個組都是最佳的可能問題

5.4.3. 計算機一直用這種方法往“決策樹”底部前進，永遠基于達到“決策樹”某一點的訓練示例集合來決定最佳問題

5.4.4. 如果示例集合在某一點變得“純凈”，也就是說，集合中只包含“垃圾”頁面或“非垃圾”頁面，計算機就能停止生成新問題，輸出對應剩余頁面的答案