機器學習為什么強大？-有解無憂

機器學習的本質就是計算機從資料中學習知識，這一程序與人學習的程序十分相似，也正因此機器學習可以有效地幫助人們解決問題，

機器學習

人的知識是怎么來呢？埃斯庫羅斯說：“ 記憶是一切智慧之母”(《被縛的普羅米修斯》)，的確，沒有記憶就沒有智慧，我們所擁有的知識，大部分都是靠記憶得來的，所以學習的程序注定艱苦，不管你有多少記憶方法和記憶捷徑，都無法突破人腦本身的限制，總是要一點一滴去記憶，我的母校中國科學技術大學的少年班是培養少年天才最知名的地方，據我了解少年班錄取過最小的學員有11歲，這差不多是最低年齡的極限了，無論多么天才，七八年的知識積累是無法跳過去的，沒有絕對的捷徑，

埃斯庫羅斯名言的英文版是：Memory is the mother of all wisdom，計算機中的記憶體就叫 Memory，記憶體用來存盤資料，在計算機的世界里這句名言應該這么說：“ 資料是一切智慧之母”，計算機比人有一個巨大的優勢，它的“記憶”（也就是收集資料的程序）需要的時間很短，遠遠比人需要的時間短，從這個角度看，假如計算機復刻了人的學習程序，那么機器學習比人更強大就是一件順理成章的事情了，實際上，在很多問題上已經是這樣了，

在機器學習領域，資料常常比演算法要重要的多，資料決定了機器學習能力的上限，資料/記憶是知識的根本，但顯然他們還不等于知識，首先我們需要對資料“解碼”，否則他們只是一堆“01”串而已；其次要從中識別出對我們有用的資訊，

人是如何從記憶的資料中獲取到知識的呢？用”識字“這個非常簡單的例子來說明一下，所有的漢字大約有10萬個，常用的漢字約有3500個，在我們還沒有學會認字之前，即使你能記住這些字長什么樣，它們在你眼里也都只是“字”，根據資訊熵的定義(https://baike.baidu.com/item/%E4%BF%A1%E6%81%AF%E7%86%B5)，如果給你一個字，在你眼里沒有區別，那么它只有一種可能取值：“字”，并且概率是1.0，我們可以計算這一資訊量，

資訊量

所以，光記住沒有用，如果不能辨識每個字的意思，你掌握的資訊量還是0，只考慮常用漢字，假設3500個漢字你已經全部掌握，再假設這些字出現的概率都是相同的，于是你掌握的資訊量如下：

3500個漢字等概率出現的資訊量

人之初，善惡無，天地混沌一片，我們一無所知，“天和地還沒有分開，宇宙混沌一片，有個叫盤古的巨人，在這混沌之中，一直睡了一萬八千年，有一天，盤古突然醒了，他見周圍一片漆黑，就掄起大斧頭，朝眼前的黑暗猛劈過去，只聽一聲巨響，混沌一片的東西漸漸分開了，輕而清的東西，緩緩上升，變成了天；重而濁的東西，慢慢下降，變成了地，” 盤古開天辟地，是人類的開始；我們識文斷字，明辨是非，是智慧的開始，

機器學習中最重要的一類問題就是分類，分類讓計算機具有了智慧，分類的概念很好理解，是非、善惡、美丑這都是分類，分類的數學模型也好理解，如下圖，

機器需要學習的就是一條”分割線“，能將平面上屬于不同類別的點區分開，

我一直覺得，就算有些理論比較難，但機器學習的概念和其要解決的問題都很好理解，如果更多人能了解一些相關知識，AI對大眾就不再是個黑盒子，那樣會減少很多不必要的社會問題，

分類問題的應用舉例

垃圾郵件識別
- 判斷是否為垃圾郵件，二分類
音樂、商品、書籍等各種推薦
- 判斷你喜歡還是不喜歡，二分類
廣告點擊率估計
- 判斷你點擊還是不點擊，二分類
小愛、Siri等語音助手
- 識別你的意圖，多分類
人類識別
- 識別是否為人臉，二分類

總之，計算機從資料中學習知識的程序與人學習的程序有很多相似之處，并且它還具有以下優勢：機器學習獲取資料的速度和數量要遠超過人類，即機器學習可以被大資料賦能；機器學習可以做到一次學習，多處復制，所以，機器學習的名字并不是白叫的，

**關注我，為你分享更多關于人工智能的知識，**

weixin

如果你喜歡以上內容，歡迎到我的個人主頁關注我：Homepage

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/33980.html

標籤：其他

上一篇：get和post區別

下一篇：請問云主機有哪些測驗工具及測驗方法，測驗指標有沒有國家標準或者國際標準