機器學習的本質就是計算機從資料中學習知識,這一程序與人學習的程序十分相似,也正因此機器學習可以有效地幫助人們解決問題,

人的知識是怎么來呢?埃斯庫羅斯說:“ 記憶是一切智慧之母”(《被縛的普羅米修斯》),的確,沒有記憶就沒有智慧,我們所擁有的知識,大部分都是靠記憶得來的,所以學習的程序注定艱苦,不管你有多少記憶方法和記憶捷徑,都無法突破人腦本身的限制,總是要一點一滴去記憶,我的母校中國科學技術大學的少年班是培養少年天才最知名的地方,據我了解少年班錄取過最小的學員有11歲,這差不多是最低年齡的極限了,無論多么天才,七八年的知識積累是無法跳過去的,沒有絕對的捷徑,
埃斯庫羅斯名言的英文版是:Memory is the mother of all wisdom,計算機中的記憶體就叫 Memory,記憶體用來存盤資料,在計算機的世界里這句名言應該這么說:“ 資料是一切智慧之母”,計算機比人有一個巨大的優勢,它的“記憶”(也就是收集資料的程序)需要的時間很短,遠遠比人需要的時間短,從這個角度看,假如計算機復刻了人的學習程序,那么機器學習比人更強大就是一件順理成章的事情了,實際上,在很多問題上已經是這樣了,
在機器學習領域,資料常常比演算法要重要的多,資料決定了機器學習能力的上限,資料/記憶是知識的根本,但顯然他們還不等于知識,首先我們需要對資料“解碼”,否則他們只是一堆“01”串而已;其次要從中識別出對我們有用的資訊,
人是如何從記憶的資料中獲取到知識的呢?用”識字“這個非常簡單的例子來說明一下,所有的漢字大約有10萬個,常用的漢字約有3500個,在我們還沒有學會認字之前,即使你能記住這些字長什么樣,它們在你眼里也都只是“字”,根據資訊熵的定義(https://baike.baidu.com/item/%E4%BF%A1%E6%81%AF%E7%86%B5),如果給你一個字,在你眼里沒有區別,那么它只有一種可能取值:“字”,并且概率是1.0,我們可以計算這一資訊量,

所以,光記住沒有用,如果不能辨識每個字的意思,你掌握的資訊量還是0,只考慮常用漢字,假設3500個漢字你已經全部掌握,再假設這些字出現的概率都是相同的,于是你掌握的資訊量如下:

人之初,善惡無,天地混沌一片,我們一無所知,“天和地還沒有分開,宇宙混沌一片,有個叫盤古的巨人,在這混沌之中,一直睡了一萬八千年, 有一天,盤古突然醒了,他見周圍一片漆黑,就掄起大斧頭,朝眼前的黑暗猛劈過去,只聽一聲巨響,混沌一片的東西漸漸分開了,輕而清的東西,緩緩上升,變成了天;重而濁的東西,慢慢下降,變成了地,” 盤古開天辟地,是人類的開始;我們識文斷字,明辨是非,是智慧的開始,
機器學習中最重要的一類問題就是分類,分類讓計算機具有了智慧,分類的概念很好理解,是非、善惡、美丑這都是分類,分類的數學模型也好理解,如下圖,

機器需要學習的就是一條”分割線“,能將平面上屬于不同類別的點區分開,
我一直覺得,就算有些理論比較難,但機器學習的概念和其要解決的問題都很好理解,如果更多人能了解一些相關知識,AI對大眾就不再是個黑盒子,那樣會減少很多不必要的社會問題,
分類問題的應用舉例
- 垃圾郵件識別
- 判斷是否為垃圾郵件,二分類
- 音樂、商品、書籍等各種推薦
- 判斷你喜歡還是不喜歡,二分類
- 廣告點擊率估計
- 判斷你點擊還是不點擊,二分類
- 小愛、Siri等語音助手
- 識別你的意圖,多分類
- 人類識別
- 識別是否為人臉,二分類
總之,計算機從資料中學習知識的程序與人學習的程序有很多相似之處,并且它還具有以下優勢:機器學習獲取資料的速度和數量要遠超過人類,即機器學習可以被大資料賦能;機器學習可以做到一次學習,多處復制,所以,機器學習的名字并不是白叫的,

如果你喜歡以上內容,歡迎到我的個人主頁關注我:Homepage
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/33980.html
標籤:其他
上一篇:get和post區別
