主頁 >
其他 > 讀改變未來的九大演算法筆記06_圖形識別
讀改變未來的九大演算法筆記06_圖形識別
2023-06-08 08:17:04 其他

1. 人工智能研究人員在過去幾十年中學到的最重要的教訓之一
1.1. 看似智能的行為有可能從看似隨機的系統中浮現出來
1.2. 如果我們有能力進入人腦,研究神經元之間連接的強度,其中絕大部分連接都會表現得很隨機
1.3. 當作為集合體行動時,這些連接強度的松散集合產生了人的智能行為
2. 圖形識別是人類具有天然優勢的一個領域
3. 圖形識別是人工智能(AI)的一部分
3.1. 圖形識別處理高度變化的輸入資料,如音頻、照片和視頻
3.1.1. 面部識別
3.1.2. 物體識別
3.1.3. 語音識別
3.1.4. 筆跡識別
3.2. 好的圖形識別系統需要巨大的人力,但這是一次性投入,并能產生長期回報
3.3. 檢驗一種圖形識別演算法在哪些情況下會失效總是很吸引人
3.4. AI處理的任務更多元
3.4.1. 計算機國際象棋
3.4.2. 在線聊天機器人
3.4.3. 人形機器人
3.5. 任務的逐漸轉變——從明顯是直覺性的任務到顯然是機械化的任務——還在繼續
3.6. 普遍意義上以及圖形識別中特殊意義上的人工智能正慢慢擴展它們的邊界,提升它們的效能
3.7. 比如
3.7.1. 一份復雜的檢驗結果中幫助診斷病人疾病
3.7.2. 在自動收費亭識別汽車牌照
3.7.3. 向某個計算機用戶展示什么廣告
4. 最近鄰分類器
4.1. 標準做法是將圖形識別看作分類問題
4.2. 讓計算機自動“學習”如何分類樣本
4.2.1. 基本策略是給計算機標記大量資料(Labeled Data):已經被分類的樣本
4.2.2. 每個樣本都帶有一個標簽(也就是它的類),計算機能運用多種分析把戲提取每個類的特性
4.2.3. 之后再向計算機提供一個未標記的樣本,通過選擇和未標記樣本特性最接近的樣本,計算機能推測未標記樣本的類
4.3. 點與點之間的地理距離,就能得出相距最近的點
4.4. 示例
4.4.1. 根據一個人的家庭住址,預測那個人會向哪個政治黨派捐贈嗎
4.4.2.

4.4.2.1. 右上角的?選擇D,左下角的?選擇R
4.4.2.2. 每個問號都被歸為其最相鄰物件所屬的類
4.5. K個最近鄰
4.5.1. K Nearest-neighbors
4.5.2. K代表3或5這樣的小數字
4.5.3.

4.5.3.1. 左上角的?
4.5.3.1.1. 當只使用單個最近鄰時,問號被歸為“R”
4.5.3.1.2. 當使用三個最近鄰時,問號被歸為“D”
4.6. 手寫數字
4.6.1. 人類也沒有這種內置知識
4.6.1.1. 通過結合其他人的詳盡教授以及觀看我們用來教授自己的例子,我們學會了如何去識別數字及其他手寫符號
4.6.2. 計算機并沒有內建手寫數字是什么樣的知識
4.6.2.1. 這兩種策略(詳盡教授和從例子中學習)也被用于計算機圖形識別
4.6.3. 計算兩個不同手寫數字示例之間的“距離”
4.6.3.1. 衡量數字影像之間的區別度,而非它們之間的地理距離
4.6.4. 區別度以百分比形式衡量
4.6.4.1. 區別度只有1%的影像是非常相近的鄰
4.6.4.2. 區別度在99%的影像則相差很遠
4.6.5.

4.6.5.1. 在每一行,都要用第一張圖減去第二張圖,并得出右邊的新影像,新影像中突出了這兩張圖中的區別
4.6.5.2. 區分度影像中突出部分所占的百分比,就能被視為原始影像之間的“距離”
4.6.5.3. 使用這種“最近鄰”距離方法的系統效果相當好,精確度接近97%
4.6.6. 運用最先進的距離衡量法,最近鄰分類器在手寫數字上的精確度能超過99.5%
4.6.6.1. 這一精確度能和復雜得多的圖形識別系統相比
4.6.6.2. 支持向量機(Support Vector Machine)
4.6.6.3. 回旋神經網路(Convolutional Neural Network)
4.7. 最近鄰分類器的特殊屬性:它們無須任何詳盡的學習階段
4.7.1. 直接使用最近鄰把戲跳到了分類階段
4.8. 在學習階段無須費力
4.8.1. 但分類階段要求我們將需要分類的每個東西和所有訓練示例進行比對
5. 決策樹
5.1. 基本上就是一個提前計劃的20個問題游戲
5.1.1. 從“決策樹”頂部開始,按照問題的答案一路往下即可
5.1.2. 當你到達“決策樹”底部的一個框時,你也就得到了最終結果
5.2. 示例:網路垃圾
5.2.1.

5.2.2. 網路垃圾制造者喜歡在頁面中加入大量流行詞以提升他們網頁的排名,因此流行詞占比較小,也預示該網頁是垃圾的概率較低
5.2.3. “訓練”頁面被真人分為“垃圾”或“非垃圾”
5.2.4. 整棵“決策樹”是由計算機程式基于約1.7萬個網頁上的訓練資料自動生成的
5.3. 如果你有足夠多的訓練資料,系統可能會向一棵能進行精確分類的“決策樹”學習
5.4. “決策樹”分類器學習階段的任務量非常龐大
5.4.1. 計算機測驗大量可能出現的第一個問題,尋找一個能得出最佳可能資訊的問題
5.4.2. 計算機將訓練樣本分為兩組,這取決于樣本對第一個問題的答案,并產生第二個對這兩個組都是最佳的可能問題
5.4.3. 計算機一直用這種方法往“決策樹”底部前進,永遠基于達到“決策樹”某一點的訓練示例集合來決定最佳問題
5.4.4. 如果示例集合在某一點變得“純凈”,也就是說,集合中只包含“垃圾”頁面或“非垃圾”頁面,計算機就能停止生成新問題,輸出對應剩余頁面的答案
5.5. 學習程序可以很復雜,但它是全自動的,而且你只需要做一次
6. 神經網路
6.1. 人工神經網路領域(Artificial Neural Networks),簡稱“神經網路”
6.2. 其學習階段不僅重要,而且直接受到人類和其他動物從環境中學習的方法的啟發
6.3. 英國科學家阿蘭·圖靈(Alan Turing)
6.3.1. 1950年發表的經典論文《計算機器與智能》(Computing Machinery and Intelligence)以其對計算機是否能偽裝成人類的哲學探討而聞名于世
6.4. 當給予相同的輸入時,“決策樹”和神經網路產生了相同的結果
6.5. 示例:帶傘問題
6.5.1.

6.5.2. 帶傘網路中的輸入和輸出信號被限制在0和1,不能攜帶任何中間值
6.5.3. 神經元在沒有用任何方法替換輸入的情況下將輸入相加
6.6. 示例:判斷人臉上是否帶太陽鏡
6.6.1.

6.6.2. 增強措施1:信號只能攜帶0和1之間的任意值
6.6.2.1. 新網路中的信號值可以是0.002 3或0.755
6.6.2.2. 一個全白的像素會發送值1
6.6.2.3. 一個全黑的像素會發送值0
6.6.2.4. 不同灰度會對應地產生0~1的值
6.6.3. 增強措施 2:輸入總和,通過加權求和計算
6.6.3.1. 神經網路考慮了每個連接強度不同的情況
6.6.3.2. 連接的強度由一個數字代表,這個數字被稱為該連接的權重
6.6.3.3. 當一個神經元計算其輸入的總和時,每個輸入信號在被加進總和之前,都會和其連接的權重相乘
6.6.4. 增強措施3:閾值的作用被軟化
6.6.4.1. 當輸入總和遠低于閾值時,輸出會接近于0
6.6.4.1.1. 輸出值接近0,則強烈暗示了不存在太陽鏡
6.6.4.1.2. 低于0.5的輸出結果被視為“沒有太陽鏡”
6.6.4.2. 當輸入總和遠高于閾值時,輸出接近于1
6.6.4.2.1. 輸出值接近1強烈暗示了存在太陽鏡
6.6.4.2.2. 超過0.5的輸出結果被視為“有太陽鏡”
6.6.4.3. 當輸入總和接近閾值時,會產生一個接近0.5的中間輸出
6.6.5. 可以將權重和閾值想象成網路中的小刻度盤,每個刻度盤都能像電燈開關中的調光器一樣調上調下
6.6.6. 最開始,這些刻度盤的值都是隨機值
6.6.7. 在多次運行完所有訓練樣本后,網路的效能基本上會達到很高的水平,而學習階段也以配置當時的刻度盤而結束
6.6.7.1. 多變數微積分(Multivariable Calculus)
6.6.7.2. 隨機梯度下降(Stochastic Gradient Descent)
6.6.7.2.1. 用于訓練神經網路的多種公認方法之一
6.6.8. 神經網路的學習階段相當耗費精力,這涉及對所有權重和閾值的反復調整,直到網路在訓練樣本上運作良好
6.6.9. 所有這些都能被計算機自動完成,而結果就是一個能簡單高效地給新樣本分類的網路
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/554566.html
標籤:其他
上一篇:一些動態幾何問題的流式演算法
下一篇:返回列表
-
- 標籤雲
-
-
- 熱門瀏覽
-
-
網閘典型架構簡述
網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......
uj5u.com 2020-09-10 02:00:44 more
-
如何從xshell上傳檔案到centos linux虛擬機里
如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......
uj5u.com 2020-09-10 02:00:47 more
-
一、SQLMAP入門
一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......
uj5u.com 2020-09-10 02:00:50 more
-
Metasploit 簡單使用教程
metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......
uj5u.com 2020-09-10 02:00:53 more
-
游戲逆向之驅動層與用戶層通訊
驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......
uj5u.com 2020-09-10 02:00:56 more
-
北斗電力時鐘(北斗授時服務器)讓網路資料更精準
北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......
uj5u.com 2020-09-10 02:01:03 more
-
【CTF】CTFHub 技能樹 彩蛋 writeup
?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......
uj5u.com 2020-09-10 02:04:05 more
-
02windows基礎操作
我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......
uj5u.com 2020-09-10 02:04:18 more
-
03.Linux基礎操作
我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......
uj5u.com 2020-09-10 02:04:30 more
-
05HTML
01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......
uj5u.com 2020-09-10 02:04:36 more
-
- 最新发布
-
-
讀改變未來的九大演算法筆記06_圖形識別
 # 1. 人工智能研究人員在過去幾十年中學到的最重要的教訓之一 ## 1.1. 看似智能的行為有可能從看似隨機的 ......
uj5u.com 2023-06-08 08:17:04 more
-
一些動態幾何問題的流式演算法
本文為 STOC'04 Algorithms for Dynamic Geometric Problems over Data Streams 的閱讀筆記。 論文作者 Piotr Indyk, 研究領域:高維幾何問題, 流式演算法,摘要資料結構維護, 稀疏傅立葉變換。 ## 1 近似演算法 在假設 $\ ......
uj5u.com 2023-06-08 08:16:52 more
-
【acwing】Trie字串統計
Trie樹 學習感受 相比于之前學習的kmp匹配演算法,Trie樹的實作還是非常好理解的。(kmp演算法太難了orz) 從直觀的模擬程序來看,trie樹就像一顆樹一樣,從上(根節點)到下(葉節點)有序串聯起來組成一個字串。 每一個額外標記結束的位置表示字串的結束,通過計算標記數即可指導一共有多少該字 ......
uj5u.com 2023-06-08 08:16:44 more
-
位元組技術面都過了,薪資都談好了20K*13結果還是被刷了,問HR,原因
分享下自己的求職小故事。在一家公司軟體測驗技術面試已經過了,然后和最終面試官溝通了下,面試官提出來一個薪資數字,我接受了這個提議并和hr同步了這個數字。再然后被拒了,理由就是期望薪資和職級不匹配。我詢問后有郵件回復我為什么面試官和面試的地區公司hr說了不算。不知道這是不是大家都曾經遇到過的情況,心情... ......
uj5u.com 2023-06-08 08:15:34 more
-
“古老”編程語言的最新選擇!華為云發布CodeArts IDE for C/C++
摘要:華為云CodeArts IDE for C/C++正式上線,歡迎體驗。 本文分享自華為云社區《“古老”編程語言的最新選擇!華為云發布CodeArts IDE for C/C++》,作者:華為云頭條 。 C語言是一種“古老”且應用至今的高級編程語言,它是多種流行編程語言的根源。C++進一步擴充和 ......
uj5u.com 2023-06-08 08:14:18 more
-
jenkins~權限控制
jenkins上管理的任務比較多,這時需要有一定的權限管控機制,我們選擇了插件`Role-based Authorization Strategy`來做這事,它支持按著專案前綴去控制你的任務,主要思想還是rbac的模式,通過角色系結權限,通過用戶來系結角色。 # 安裝之后 :AI玩轉PPT
在線免費體驗ChatGpt:https://www.topgpt.one;作為許多職場人士的必備工具,PPT制作一直是一個瑣碎而費時的任務。但最近我發現了一個非常有用的工具網站,它可以通過人工智能來制作PPT,這款工具可以輕松制作出漂亮和專業的PPT,讓你在短短的三分鐘內完成制作,效果也是非常出色的... ......
uj5u.com 2023-06-08 08:11:58 more
-
一分鐘了解自動化測驗
目前自動化測驗并不屬于新鮮的事物,或者說自動化測驗的各種方法論已經層出不窮,但是,能夠明白自動化測驗并很好落地實施的團隊還不是非常多,我們接來下用通俗的方式來介紹自動化測驗…… ......
uj5u.com 2023-06-08 08:11:24 more
-
什么是測驗金字塔?如何使用測驗金字塔來構建自動化測驗體系?
測驗金字塔理論推薦單元測驗應該是數量最多,覆寫范圍最大的測驗種類。道理很簡單,單元測驗成本低,運行速度快,在發現問題的時候解決問題也最快。集成測驗數量次之,最后才是昂貴的端到端測驗。由于端到端測驗經過的環節更多,所以通過端到端測驗發現的問題,解決起來用時更多。 ......
uj5u.com 2023-06-08 08:11:09 more
- 友情鏈接
-
-