主頁 >  其他 > 【人工智能行業大師訪談2】吳恩達采訪 Pieter Abbeel

【人工智能行業大師訪談2】吳恩達采訪 Pieter Abbeel

2021-08-17 06:42:04 其他

來源:Coursera吳恩達深度學習課程

作為deeplearning.ai課程的一部分,Andrew希望除了教授技術理念之外,同時介紹一些深度學習的先驅給大家認識,在這個視頻中,Andrew也希望問問這些先驅們,能不能給一些作業上的建議,關于如何入門深度學習,如何做課題研究或者如何在深度學習領域找一份作業,作為這個采訪的開頭,很榮幸先展示Geoffrey Hinton的采訪視頻【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton,接下來,采訪 Pieter Abbeel,文章末尾有總結,

吳恩達:謝謝你,Pieter,能夠來到這,很多人都認為你是一位有名的機器學習、深度學習、機器人技術的研究者,我想讓更多人知道你的故事,你是怎么開始的呢,

Pieter Abbeel:這是個好問題,要是你問14歲的我,我的志向在什么,可能就不會是現在的答案,那時候我想當職業籃球運動員,我不認為我能做到,

吳恩達:機器學習僥幸做成了,籃球應該沒戲,

Pieter Abbeel是的,沒戲,打籃球很好玩,但是變成職業不太行,在學校我最喜歡物理和數學(physics and math,所以之后學工程就比較自然,也就是實際應用物理和數學,之后,我本科畢業于電子工程后,我不太確定做啥,因為工程相關的一切都太有趣了,去懂得一個東西如何運作很有趣,建一個東西也是某種意義上,AI贏了,因為看起來它在某種程度能幫助所有學科,并且它看起來是一切東西的核心,你會思考一個機器怎么思考的,那可能是一切的核心,也就不用選某個特定的學科,

吳恩達:我一直在說AI是新的電力(AI is the new electricity),聽起來14歲時的你,已經有很超前的意識,過去幾年你在深度增強學習中貢獻很大,現在情況如何,為什么深度增強學習(deep reinforcement learning)突然變得重要?

Pieter Abbeel在我研究它之前,我研究了很多增強學習,與你和Durant在斯坦福的時候,當然了,我們做了自主直升機飛行,后來去伯克利和我的學生們,做了個會疊衣服的機器人,可以說是用組合的學習方式來描述,做成一些不學習就無法做成的事,也結合了領域知識才能完成,這很有趣,因為你需要領域知識,想辦法學到很好玩,但同時每次想做成新的應用都會很耗時,需要領域知識(domain expertise)和機器學習知識(machine learning expertise),在2012年,通過Geoff Hinton多倫多小組對ImageNet的研究結果突破,AlexNet證明監督學習,突然之間大大減少了工程量,AlexNet中所用的工程量非常之小,讓我開始思考,我們該用類似觀點回顧增強學習,看我們能否用增強學習做與監督學習同樣有趣的事,

吳恩達:聽起來你早于,大多數人前,發現深度監督學習的潛力,展望未來,你看到下一件事是什么,你對下一階段有什么樣的預測在深度增強學習中

Pieter Abbeel我認為深度增強學習有趣在于,某種程度上比監督學習有更多的問題,在監督學習中問題在于輸入,輸出,映射;在增強學習中是資料是從何而來的,就是探索問題本身,當你有資料之后,你怎么做信用賦值,你怎樣理解早期做什么,才能之后受益以及安全問題,當你有自主收集資料的系統后,在很多情況下其實很危險,想象一家自駕車公司說,我們只會用深度增強學習來運行車輛,聽著就像會有很多事故,在真正起作用之前,

吳恩達:你需要反面例子(negative examples),對吧,

Pieter Abbeel是需要反面例子,希望也有正面的,我覺得深度增強學習還有很多挑戰,在解決特定問題時如何做成功,深邃的部分在于表達,增強學習本身還有很多問題,我個人覺得是深度學習的進步,一部分增強學習的謎團能被解開,就是表達的部分,如果有模式,我們可能表達為一個深度網路,并抓取模式,怎么分解模式仍然是增強學習中很大的挑戰,我認為大挑戰在于,如何讓系統在長時間線上保持推理能力(how to get systems to reason over long time horizons.,現今很多深度增強學習,都是短時間線上的,還有很多問題是,如果對五秒的反應不錯,對整個問題的反應都會不錯,五秒和一天的規模相差很大,或是讓機器人或軟體主體保持一輩子的功能,我認為這里面有很多挑戰,安全方面的挑戰是當效果已經很不錯時如何安全持續地學習,所以,再舉個例子,很多人對自主駕駛車(self-driving cars)很熟悉,讓它們比人開車更好,假設人在每三百萬英里,碰到一次很糟的事故,會需要很長時間才會有負面資料,如果和人一樣好的話,但你想要更好,那么資料的收集就變得很難,很難得到讓系統表現更好的資料,探索其中有許多牽連的挑戰,我最興奮看到的是,我們能不能往后一步,還是能學增強學習的演算法,增強是很復雜(So reinforcement is very complex),信用賦值(credit assignment)也是,探索(exploration)更是,就像對于深度學習中的監督學習,可以做到替代領域知識,可能也能有程式--增強學習的程式也能做到取代我們親自設計細節

吳恩達:學習回報函式還是整個程式?(learning the reward function or learning the whole program?),

Pieter Abbeel這就需要學習整個增強學習程式,可能是,想象一下,你有這么個程式,不管是什么,你給它一個問題,看多久才能學會,然后發現,嗯,花了挺久,讓另一個程式來修正原本這個,加完這一步,試試看,要是學的快多了,修正的就很好,然后從此想辦法繼續進步,

吳恩達:我明白了,奠定基礎,

Pieter Abbeel這可能和可用的計算量有關,就像在內環中運行增強學習,現在,運行增強學習是最后一步,越多計算量越有可能運行的了,就像在內環的增強學習是更宏觀演算法的一部分,

吳恩達:從14歲起,你在AI作業有二十多年了,你怎么理解AI這段時間的進化

Pieter Abbeel我試著理解AI的時候很有趣,因為其實與我在斯坦福的碩士學位相符,其中有很多領袖我親自交流過的,比如John McCarthy,相比較2000年時,用的方法與眾不同,和大多數人在做的事不同,然后和Daphne Koller的交談,形成了我對AI最初的想法,她的AI課程,她的概率圖模型課(her probabilistic graphical models class),讓我真正產生興趣,隨機的變數如何應用于簡單的分布,再被分成子集變數(subsets variables),然后其他的結論,都會讓你知道好多,要是能讓它計算起來也容易,那就很具挑戰了,從那之后,我開始攻讀博士,你到斯坦福后,是個很棒的現實提醒,也就是,不該去檢驗你研究里的度量是否正確,而是去看一種關聯(connection,你在做的事情和影響你的東西之間有何關聯,你的研究實際改變了什么,而不是具體里面出現的數學

吳恩達:對,很棒,我沒發現之前遺忘了這點,

Pieter Abbeel是的,這是其中一件,除了大多數人在問的,哪一個Andrew給的意見,一直在影響你,是確保你能看到這種關聯性

吳恩達:你已經并且會繼續在AI領域有很棒的職業前途,對一些在看視頻的人,要是他們想入門AI,你有什么意見

Pieter Abbeel:我想現在是進入AI的大好時機(I think it’s a really good time to get into artificial intelligence需求量是如此之高,作業機會如此之多,有大量研究課題,也有大量創業機會等等,所以我很肯定決定入行是很機智的決定,你們中的大多數都能夠自學,不管是不是在學校里,有好多好多網課,比如Andrew的機器學習課,也有,比如說,Andrej Karpathy的深度學習課,也有線上視頻,作為開始很棒,Berkeley也有增強學習的課程,所有課都在網上,都是很棒的入門方式,很重要的是,你自己要真正著手去做(make sure you try things yourself,不是只看看視頻,要親自試,可以用TensorFlowChainer,TheanoPyTorch等等,隨便你喜歡哪個,開始是很容易的,進展也會很快

吳恩達:只要不斷練習,對不,實際操作并關注什么成功了,什么沒成功,

Pieter AbbeelMashable上周有篇文章,講一個英國16歲,Kaggle比賽中的領導,里面提到他跑去學習,在網上找到東西,自學了一切,從未上過任何正統課程,一個16歲的少年能在Kaggle上有這么強的競爭力,說明是真的可能,

吳恩達:我們生在好時代,對人們學習的好時代(We live in good times. If people want to learn

Pieter Abbeel完全正確,

吳恩達:還有個應該常被問到的問題是,要是有人想進入AI機器學習,深度學習的領域,他們該讀博還是去大公司作業

Pieter Abbeel很大程度上取決于你能得到的指導(I think a lot of it has to do with maybe how much mentoring you can get.,在博士學位里,基本肯定的,是教授的本職作業,也是你的導師,會來主動找你,竭盡他們所能去成就你,幫助你在任何領域,比如AI,得到成功,有很多用功的人,有時會有兩個導師,那是他們的本職作業,也是為什么他們當了教授,大多數教授都能幫助學生做更多事情,但不是說在公司里不是這樣,很多公司有很棒的導師并且很愛幫助教育和推進其他人等等,只不過是,可能不會有那樣的保障,不會像攻讀博士一樣,而博士的一大優點,就是你肯定能學到好多并且總有人能幫助你學習,

吳恩達:取決于公司和博士專案本身,

Pieter Abbeel完全正確,但是我想,主要還是得自己能學很多東西(it is key that you can learn a lot on your own要是自學的很快,再加上一個更有經驗的人,能加速程序,因為他們的職責就是幫助推進你的進步

吳恩達:你是深度增強學習中很有名的領袖之一,那么是什么樣的東西,在深度增強學習中已經很成功了,

Pieter Abbeel關注深度增強學習中的成功例子,非常非常引人入勝,比如說,通過像素學習玩Atari,處理像素也就是被處理的數字,被變成一個游戲中的行動,然后,舉個例子,我們在Berkeley做過的一些研究,造了會走路也有回饋的模仿型機器人,只是簡單的告訴它越往北走越好,對地面影響越小越好,它突然會選擇,走路或跑步,即使并沒有人告訴它什么是走和跑,或讓機器人學講給兒童的故事,并想法子組在一起,創造更多開放結局等等,

我認為有趣的是,它們能學習,從原始的感覺輸入到控制,比如發動機中的扭矩,但是是同時完成的,有趣在于你能用一個單一演算法,比如,推力是一瞬間的(thrust is impulsive),你可以學習,可以讓機器人學會跑,學會站立,可以有兩條腿的機器人,再換成四條腿的,只要用同樣的演算法,它都會跑,所以增強演算法不用改變,非常宏觀,Atari游戲也是如此,每個游戲里DQN都是同一個DQN,當它開始進入,還未曾實作的邊界后,它能為每一個任務從頭一點點學起,但要是能重復利用,之前學過的東西,更好了,那樣學下一個任務就更快了,這是目前未能實作的事情,本質上,它總是從頭學起,

吳恩達:你覺得多快,就能看到使用深度增強學習的機器人,出現在我們身邊,被廣泛應用在全世界

Pieter Abbeel我認為真實情況是,從監督學習開始,行為克隆,人類的作業,我覺得會有很多業務會建立起來,但總是有人類在幕后指揮作業,比如Facebook的資訊助手,像這樣的助手能被建起,但背后一定有人,做大量作業,機器學習能做人所做的事,并開始為人們提建議,人類會被提供,有限的幾個選擇,過一陣子,就能變得更好,可以給增強學習,一些實際目的,而不是讓人在幕后作業,是實際給它們目標去完成,比如,兩者中哪個能更快計劃好會議,或多快能定好機票,或是花了多長時間,滿意程度如何,不過可能會需要大量克隆人類行為的引導程式,去告訴它們怎么做,

吳恩達:聽起來行為克隆:是監督學習,去模仿人在做的事,之后逐漸增強學習會能思考的更長遠,這樣總結合適嗎?

Pieter Abbeel我覺得是,單因為觀察增強學習,從頭開始,就很有意思,超級有趣,很少有比觀察增強學習機器人從啥都不會到發明創造更好玩的事了,不過非常耗時,而且不總是那么安全,

吳恩達:太謝謝你了,這個采訪太棒了,我很榮幸我們有這次聊天機會,

Pieter Abbeel:謝謝你邀請我,我非常感謝,

總結:(1)不管是選擇讀博還是進入大公司,主要還是得自己能學很多東西(it is key that you can learn a lot on your own要是自學的很快,再加上一個更有經驗的人,能加速程序,因為他們的職責就是幫助推進你的進步

(2)我想現在是進入AI的大好時機(I think it’s a really good time to get into artificial intelligence需求量是如此之高,作業機會如此之多,有大量研究課題,也有大量創業機會等等,很重要的是,你自己要真正著手去做(make sure you try things yourself,不是只看看視頻,要親自試,可以用TensorFlowChainer,TheanoPyTorch等等,隨便你喜歡哪個,開始是很容易的,進展也會很快

說明:記錄學習筆記,如果錯誤歡迎指正!轉載請聯系我,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/294111.html

標籤:AI

上一篇:Batch Normalization(批標準化)的原理和意義及對模型的重要影響

下一篇:通過anaconda下載 opencv的方法

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more