作者 | 八寶粥
出品 | CSDN(id:CSDNnews)
隨著AI 技術的發展,國內外涌現出一大批基于AI 落地的工業專案,例如無人車,巡檢機器人、倉儲智能系統等等,2019年,一家以 AI 視覺為主要技術、專注智能制造和超高清視頻的企業誕生,該企業由香港中文大學終身教授、IEEE院士賈佳亞主導創立,核心團隊深耕計算機視覺領域20余年,這家企業就是思謀科技,本次采訪嘉賓,思謀科技聯合創始人、技術負責人劉樞,今年11月,劉樞作為先進制造業的杰出青年企業家,入選《2020胡潤Under30s創業領袖》榜單,
內容要點
工匠精神,如果這個事還能看到哪些地方可能沒有做好,或者覺得有提升的地方,那這個事其實還沒有完成;
身份轉變后,更多地考慮宏觀技術架構,如何把握技術方向、讓公司的技術保持領先優勢;
智能制造和超高清視頻,選擇兩條賽道列入國家“新基建”,前景明朗;
專案落地,保障高準確率和召回率,提供客制化解決方案;
深耕專業領域,努力做到行業頭部,
以下為采訪全文,在不改變原意的情況下進行了部分編輯:
明確目標, 把事情做到極致
CSDN: 從個人經歷來看,您在大學就是本科特優生,專業排名第一,25歲博士畢業,可以說是不折不扣的學霸,請問您是如何保持優秀的?
劉樞:首先是要明確目標,為了目標不斷努力,如果大家希望能得到一個好的成績的話,肯定是在考前認真復習,做足準備,另外既然是決定讀博,有好的成果出來,就需要花時間去學習已有的方法、思考如何創新,沉淀出自己的知識,這一點和賈老師之前跟我說的“工匠精神”十分契合,“工匠精神”對我的影響也比較大,當時賈老師說:“做事情一定要做到極致!如果覺得這個事自己還能看到哪些地方可能沒有做好,或者說覺得還有能提升的地方的話,這個事情其實還沒有完成”,
前面提到的是內在的部分,其實外在的環境也非常重要,在賈老師的團隊當中,師兄弟們差不多都是各個名校的第一名,有些同學已經有了文章,有些同學手握 ACM 金牌,都有非常強的點,和優秀的同學一起學習交流,就是 push 自己不斷變強,對自己有要求,就會不斷進步,這種氛圍和環境都是可遇不可求的,和他們一起讀書、在思謀共事,我覺得非常幸運,也非常享受這個程序,
CSDN: 很多還在讀博的朋友還在發愁論文和畢業,作為 20 余篇論文的作者和頂級學識訓議 NeurIPS 和 ICCV 的審稿人,這方面有什么經驗可以和大家分享呢?
劉樞:這方面我感觸很多,做研究一定要沉下心來,不能浮躁,Research 這個詞,拆開來看就是反復地 Search,反復搜索,本身就告訴大家,這個程序不會一帆風順,而是一個需要不斷嘗試、失敗再嘗試直到成功的程序,如果遇到一點問題就放棄了,肯定做不出好的作業,舉個例子,我當時在打 COCO 比賽的時候,第一步需要復現一個經典的作業,Mask R-CNN,花費了很長時間,結果還是有零點幾到一個點的差距,為了這個問題花了大概一周的時間,不斷尋找問題到底出在哪里,研究后期我做夢的時候都在 de 這個 bug,非常玄幻的是我夢到了一個位置,而且真的就是這個地方的問題,所以我覺得一定要投入進去,認真去做、反復研究,很多時候問題自然就能解決了,
另外我認為要多想、多試,我也經常和同門師弟師妹討論問題,給他們一些建議:發現問題的時候一定要大膽假設小心論證,敢于想新的問題、新的點,而后自己通過做實驗,把自己的假設驗證成功的時候,就很有意義,兩者結合起來就能得到一個好的效果,關于論文的話,也不必太過發愁,要享受研究程序,做出好的研究,發文章也是自然而然的事情,另外我認為發文章也不是衡量一個博士能力的唯一標準,讀PhD 也是培養自己去發現問題、分析問題和解決問題這樣一種能力,這是一個博士核心的能力點,只有掌握這一套方法論,才能擔得起 PhD 這個 Title,
角色轉換,萬變不離其宗
CSDN: 您從騰訊的高級研究員到聯合創辦思謀科技擔任技術負責人,經歷了怎樣的心路歷程,對于身份的轉變有什么體會?
劉樞:在騰訊的作業會更加具體,主要是自己或者一個小團隊一起做事,不會特別宏觀,后來聯合創立思謀科技,作為技術負責人,會考慮更加宏觀的問題,這時候責任和壓力就更重一些,目前考慮的肯定是宏觀技術架構,如何讓我們的技術體系保持先進性和可擴展性,同時必須要預見技術發展方向,讓公司保持技術優勢,
這個層面主要還是我們或者我自己對于技術的把握和理解,如何讓技術優勢實際地去服務公司的產品和落地專案,我們的技術要打造成什么形式?比如單點工具或者線性工具鏈,或者是更加整合的一個平臺,如何降低交付成本,提升交付效率都是需要從更宏觀的層面去考慮的,當然還需要考慮怎樣提升產品易用性、泛化性,還有在最終的結果上超過對手,這都是目前考慮的問題,
此外還要考慮我們的技術如何配合整個公司的戰略方向,提前做好技術布局和支持,總體來說,現在考慮的事情更加宏觀,壓力也更大,但也更有激情,因為我覺得把這些事做好之后,整個公司技術研發的同學都能夠非常開心地作業、快速地成長,還是非常有成就感的,
CSDN:計算機視覺在工業應用和實作,和在學術界或者比賽當中解決問題的情況對比,有什么異同?
劉樞:工業應用主要是關心技術產品能否滿足客戶最終要求,比如要求達到某個準確率、召回率,完成時間等等,更多的是考慮能否達標,而且解決的也是雜糅的問題,比如我們會發現資料集當中有一些長尾分布、小樣本或者臟資料問題,還有如何去增量學習等等,我們為了最終的指標去不斷解決問題,這個和打比賽比較像,因為打比賽也是給出資料集和最終的指標,我們對目標結果去做優化,和工業界的追求的目標是一致的,
而學術界發文章,更多的是去解決一些單點問題,比如前面提到的長尾分布、小樣本、臟資料等等,它們本身就是一個個研究的 topic,有很多值得研究的地方,許多文章只是為了去解決一個問題,而且,發文章也不僅僅是為了追求最后的性能怎樣,文章本身的創新性也是非常重要的衡量標準,
在發現問題、分析問題、解決問題,提升性能這些方面的方法論都是相通的,工業應用中解決難題其實也是很好的研究作業,我覺得計算機視覺本身就是偏實踐和應用的學科,學術界和工業界沒有那么割裂,在工業界也可以做出非常好的一些研究成果,
選擇賽道,突破演算法局限
CSDN: 思謀科技選擇了智能制造和超高清視頻兩條賽道,這種選型是出于怎樣的考慮?
劉樞:我們公司在 19 年底成立的時候,就已經選擇了這兩條賽道,當時我們是基于對市場判斷和技術的把握做出的選擇,今年年初,國家發布了“新基建”重大戰略,智能制造和超高清視頻這兩個賽道均屬于“新基建”領域,我們非常激動,覺得在做正確的事情,
選擇智能制造的原因是這樣,制造業考慮的是怎么把東西造出來,如何做好,然后提升自動化率,怎樣進行智能化制造,產業轉型升級是一個很大的需求,疫情期間制造業受到了非常大的影響,在復工復產的時候,如果產業自動化率高、需要人力少的話,就非常容易,目前大家可能都是用 AOI 機臺,加上機器視覺的方法進行缺陷檢驗,隨著國內外制造業巨頭對于品控要求的升級,整個行業的品控要求也不斷提升,這時候引入 AI 來解決之前機器學習解決不了的問題,就是水到渠成,整體來看,我們認為在智能制造方面有很大的市場規模,對于 AI 匯入的需求也越來越高,是一個很好的切入點,
關于超高清視頻,我們可以把 5G 看作是一個管道,隨著技術越來越成熟,管道越來越多,里面的水或者叫做媒介,就是視頻,此次疫情原因也引爆了居家辦公和娛樂的熱情,居家辦公當中,支撐視頻會議重要的技術就是視頻處理,娛樂也一樣,比如我們有 4k 屏等高清的硬體設備,就需要有片源,超高清視頻的需求目前不斷增加,以居家娛樂為例,我們可以在傳輸當中使用更低的碼率和質量,在端側進行超清化處理,視頻會議也一樣,我們如何保證端側的畫質和傳輸的效率,如何對視頻的內容有較好的理解,
無論在智能制造還是超高清視頻領域,我們都有雄厚的技識訓累,加上巨大的市場前景,我們就選定了這兩個最重要的賽道,
CSDN: 今年早些時候賈佳亞教授曾經談到通過AI體系架構的研發和落地,突破單一演算法能力升級的局限,幫助產業客戶實作全面數字化、自動化和智能化,思謀目前提供了哪些產品和解決方案,有哪些成功案例可以同大家分享一下?
劉樞:我們在智能制造和超高清視頻上,目前有兩個較大的產品,智能制造的 SMore Factory 和超高清視頻的 SMore Media,
SMore Factory,主要是針對工業場景中制造程序、質量檢測和設備維護等環節的問題,提供全流程一站式的賦能和管理能力,這里面包括兩個形態,一個是叫做 SMore ViMo (Vision Inspection and More) 的一個軟體平臺,另外一個是端上的一個智能的硬體,叫做 SMore Edge,
關于SMore ViMo,我們提供整套軟體平臺,它包括物體分類、缺陷檢測、影像分割,還有 OCR 這4個比較核心演算法,軟體平臺本身除了 AI 演算法能力之外,也能夠滿足整個工業生產的需求,比如集中式專案管理、分布式的資料存盤,包括資料標注,客戶也可以自己去訓練模型,最后去根據能夠把訓練的模型能夠做到一鍵的部署去測驗等等這些業務的需求,對于比較難的演算法的問題,我們會派出優秀的演算法工程師提供客制化的解決方案,然后可以再把它打包放到 SMore ViMo 里面去,作為我們最終的一個交付形式,
SMore Edge 主要是一個邊緣側的一些智能的相機等一些智能硬體,主要是為了解決像掃碼 OCR 等進行智能識別的一些需求,除了軟體層面,我們現在也有一些硬體的 AOI 機臺,例如我們在 VisionChina (中國機器視覺技術展覽會) 也展出了我們的晶圓外觀智能檢測設備,整個內外的這種方式,我們能夠提供整個硬體的 AOI 機臺在打包我們自己的 AI 的演算法方案,然后完成一個整套的解決方案,
超高清視頻方面我們的產品是 SMore Media,是從整個視頻的內容的生產到呈現的全鏈條 AI 解決方案,包括畫質的處理引擎、超高清一體機以及智能處理器,這個方案能夠提供到端的影像和視頻的畫質增強能力,能夠根據具體一個場景去選擇最合適的方案,提供云上的部署以及端側的部署等不同的交付場景,
我們在3C、新能源以及汽車等行業已經有一些具體的落地專案,例如我們為一家國際知名的3C 巨頭 ,落地的多種 AI 外觀缺陷檢測專案,包括 20 多類缺陷的外觀識別,最后實作召回率在 99.6% 以上,誤差率在 2% 以下,高質量地通過了驗收,這里只是簡單舉個例子,更多案例在我們網站上也有具體的展示,
積累人才,蓄力提速布局
CSDN: 作為思謀的技術負責人,思謀建立技術團隊有怎樣的選擇標準?
劉樞:首先,優秀的人才是我們最寶貴的資源,我們最近也在大力招聘,選擇的標準,首先最重要是一定要志同道合,認同我們的文化價值觀,
其次,整個的創業程序,一定會遇到很多“坑”,可能有一些艱難時刻,這時候有共同的文化認可,大家才能團結一致,把事情做成,所以我們把價值觀的認同擺在第一位,具體到個人的品質就是要踏實肯干、實事求是,因為技術本身是一個比較客觀的,做的時候一定要腳踏實地,千萬不能飄,另外一定要清楚自己的優勢和劣勢,盡快取長補短,把自己的一些缺點或者說欠缺的地方補上來,這才是一個比較好的技術同學所需要具備的一些品質,此外,我希望我們的伙伴對技術本身一定要有追求,不能說淺嘗輒止或者非常容易自滿,隨隨便便做了一個東西,就覺得做得非常不錯了,其實很多時候還有很多成長和提升空間,大家一定要對自己有一個明確的認識,
最后,我覺得如果有很強的專業背景當然是最好的,屬于錦上添花的事情,如果沒有的話,我們也很樂于去培養像上面提到的踏實肯干,學習能力強,同時對技術有追求,能夠不斷去提升自己的同學,這些都會是很好的候選者,
CSDN:思謀科技目前在深圳、上海、香港、蘇州都設立了研發與商務中心,同時也交付了多個境外專案,推進全球化商業步伐,請談談思謀下一步的發展規劃,
劉樞:發展規劃主要是兩個層面,首先我們會繼續加快招聘步伐,持續地加強對于研發、銷售人員,尤其是整個業內頂尖人才的招聘力度,盡快去培養和壯大骨干隊伍,包括一些中層管理等,來適應我們整個公司的發展需要,這方面我們后續也會重點關注、重點開拓,
另外是商業層面的布局,目前我們在海內外都已經有了一些初步的點,一方面會繼續重點開拓海外的業務市場,對于海內外兩個市場相關行業的擴展我們也會進行提速,前面提到,我們已經 3C、新能源還有汽車等行業有一些專案交付完成,此后將在這些高端制造業里面繼續深耕,盡量把自己做到這個行業里面的頭部,我們將在落地的行業中繼續打磨自己的產品,呈現新的技術,也會快速地去復制到一些相關的行業里面去,去接觸到更多的客戶和更多的場景,對于海外的,我們也會用同樣的方式快速地去復制遷移和場景落地,
推 薦
CSDN公眾號全新搜索技能上線啦!只要在公眾號后臺回復訊息就能自動回復想搜索的內容啦!簡直是程式員必備的搜索神器!
猜猜回復“Mysql安裝”會出現什么
點分享點點贊點在看
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/227161.html
標籤:AI
