主頁 > 軟體設計 > 北大博士的CVPR冠軍體驗:一群直男強行“認草”

北大博士的CVPR冠軍體驗:一群直男強行“認草”

2021-07-23 08:35:06 軟體設計

今天聊聊淘系 CVPR 競賽另一個冠軍:Herbarium 2021 - Half-Earth Challenge,一個最終準確率高到外界懷疑我們雇了個植物學家參賽的故事,

前篇回顧: 如果你看過上期冠軍少麟的故事【僅9天拿下CVPR競賽冠軍,家里的狗狗都改了作息】,今天的冠軍元年主要有2個不同點:第一,他提前3個月開始著手準備;第二,他同時參加了3項挑戰賽,

“暴力青年”的非尋常之路

獅子座的元年,在隊友眼里是個“暴力青年”,

走在路上要是有石頭擋路,別人選擇繞道,他選擇推開;一起打乒乓球,無論對方出什么樣的刁鉆球,一招暴力扣殺吃遍天下;團隊outing,大家走著穩穩的山路,他非要跑去野山坡自行開路,不見懸崖不回頭……

“很有張力,很激進,但也很令人安心,”

這么一個獅子座的青年,帶著他的處女座水瓶座摩羯座同事們,拿下了 CVPR 2021 三個競賽獎項,將冠亞季軍收入囊中,(迷信星座的演算法團隊們哈哈哈)

元年:路在哪兒?腳下!

一群直男強行“認草” :綠得相差無幾

本科學習微電子,保送到北大直接攻讀物理博士的燕保明(花名:元年),原本是個計算機的門外漢,

“就不想焊電路了,也覺得基礎物理太難在短時間內看到突破,就自學演算法了,”

縱使是這么恐怖的學習能力,以及這么彪悍的發言,元年也萬萬沒想到,這次競賽自己要搞的是——植物學

Herbarium 2021 - Half-Earth Challenge,屬于“大規模實體級物體識別”的技術域,比賽資料集為從多個大型植物園收集的美洲、大洋洲等半個地球的6.5W類2.5M張植物樣本圖片,用于訓練植物識別演算法,輔助植物學家進行植物識別,發現和保護新物種,

不同于元年作業中對于淘寶商品的識別判斷,植物的分科和類別相當細致,分辨不同植物需要專業的知識,視覺上區分的難度很高;另外,資料集的樣本極度不均衡,最少的類別僅有3張樣本,如何提升長尾類別準確率是這場競賽的核心難題,

???? 大型“六親不認”現場

“我們把一些結果可視化出來后,大家都忍不住吐槽,這堆草到底有什么區別?!”

(難為這些口紅顏色都無法辨認的演算法直男們)

元年率領的競賽小分隊,此次一共參加了 CVPR 3項不同的競賽,當隊友埋在一堆綠油油的圖片里崩潰時,勸他說,要不我們放棄這項,把更多精力投入到別的賽程上去,“暴力青年”元年斬釘截鐵地拒絕了,

在他的觀念里,演算法本身就是快速除錯問題,以方便你找到下一個問題,至此,他們開始了這次 38 次比賽結果提交之路,

技術人的極客精神:同時玩3個也不帶怕的


原本對于“實體級物體識別”這個領域,元年是有著自己的驕傲和信心的,

在做淘寶直播看點的業務期間,要求將商品和直播間關聯起來,用戶點擊商品就能跳轉到正在講解的直播間,淘系多媒體演算法團隊在檢索商品的領域已經有了相當好的方案,此前相關領域比賽也有比較高的資料指標,當他們用類似方案跑本次比賽資料時,一刷準確率,卻不到70,

淘寶直播看點背后的商品識別演算法

“分類和檢索還是不一樣,我們經過研究發現,必須要把特征的學習和分類解耦開,正是這個思想,我們掌握到了這次比賽的黑科技,”

這也是“獅子”元年帶給小伙伴們最大鼓勵的地方,無論在看起來多么“窮途末路”的情況下,他總能源源不斷提出新的想法和策略,并且現場發散出更多,

“要是想早點吃飯,開會的時候就別讓元年說話,” 隊友蘭枻哭笑不得,

主管濟宇對元年的這份源源不斷的活力和突破精神也深有感觸,2018年元年校招入職,濟宇直接將一個重要的業務需求丟過去,并告知2個月上線,毫無作業經驗且無辜的元年一個半月完成了工程問題和演算法部署;2019年初,他要求體現一下技術深度,隨即元年以一作的身份發了兩篇論文;現在,當他想著,為什么不打個比賽呢?于是元年帶隊在CVPR的三個賽道分別拿下冠軍、亞軍和季軍,

元年小組另兩項比賽是Hotel-ID 2021-Hotel Recognition Challenge 和 Evoked Expressions from Videos (EEV) Challenge ,大家都是剛畢業幾年的同學,既要保證不耽誤手頭的業務,還要同時推進三項比賽,這對于大家比賽期間的時間和精力管控,提出了更大的挑戰,

要是機器會講話,它可能感受最深刻,并想跳起來打人,

“因為資源有限,我們的原則是一定不能讓機器閑著,跑完一個就下一個,啥時候跑上新任務,我們啥時候睡,周末也不例外,”

元年小組對于3項比賽做了側重點分工,每個小伙伴都有自己重點參賽專案和獨立跟進的部分,并保持著【方案嘗試-問題總結-交流提升】的協同操作模式,元年則保持著對每項比賽進展和下一步方案的調研研究,

“我的伙伴們真的很給力,比如蘭枻,我們的模型訓練日志都是放在OSS上,他瘋狂到把所有的日志都發送到手機上,方便實時刷資料結果,就算是凌晨兩三點看到資料有異樣,彈起來就拿電腦,這也是我們技術人的極客精神吧,

不負有心人,Half-Earth Challenge 這一場最終憑借領先亞軍2.2%的優勢,一舉獲得冠軍,另兩場也分別取得了第二、第三的好成績,這是元年小組首次在視覺影像維度嘗試實體級檢索,未來他希望可以拓展到內容檢索這個更大的范疇,一方面通過多模態的資訊更好的去理解用戶的檢索意圖,另一方面結合多模態資訊實作更好的視頻內容多維度表征,在對跨模態學習、因果知識解耦等眾多基礎問題的不斷探索和攻克中,用技術的突破為淘寶用戶帶來更好的內容消費體驗,

Half-Earth Challenge 比賽結果

跨領域學習“超能力”如何煉成?

4年前,還在北大低溫量子實驗室的儀器旁,偷偷用零下兩百度的液氮凍水果的元年,絕對沒有想到,未來的他搞起了計算機視覺演算法,

物理是相對“枯燥”和偉大的學科,需要漫長的時間實驗和提煉,元年眼睜睜看著他入學初始,一個從他開始搭建儀器的問題,直到他博士畢業,師弟師妹們還在攻克這個……他開始思考如何能找到反饋比較快的方式實作自己的人生價值,

“我的偶像是鋼鐵俠馬斯克,他在太空探索、汽車、能源、高鐵、互聯網、人工智能等領域都做出了顛覆性的成績,”

自詡為“物理里面會搞計算機,計算機里面懂物理”的元年,和他的偶像一樣,關鍵點是 get 了一種名為【遷移學習】的能力

馬斯克發表在 Reddit AMA 上的回答曾經描述過,他有2個步驟實作這種超人般的領域互通,首先,學會把知識解構為若干基本原理,就像一棵大樹確保理解樹干;其次,將這些基礎原理在新的領域重構,不斷問自己兩個問題:“它讓我想到了什么”以及“為什么會讓我想到它”,

當學會在更抽象的層次中去思考問題的共通點時,我們更能理解到天才并不是天賦異稟,而是有更加科學正確的學習技巧,

當然,實在鴨梨山大想不明白的時候,元年就喜歡去徒步和登山,同樣是物理系的硬核老婆,也會陪著他自駕西藏,在廣袤的天地山河間,思想是破碎還是重組,都不是事兒,

硬核元年和硬核老婆在西藏(狗糧的味道)

沒事,“學霸”也是德州撲克輸最多的

意外的是,相比他處女座水瓶座摩羯座的隊友們,這只獅子玩起德撲來,基本是送錢的“小可愛”,

“他就是,如果一開始看自己牌面很好,就突然加很多籌碼,最后都給我們做貢獻了,”好基友蘭枻作為穩健派,忍不住吐槽,

對此,元年一本正經地表示:對于玩起來容易上頭的游戲,一定不要想那么多,上頭就對了,(好的,我們信了)

不同于大家對學霸人群“高分高能,學啥玩啥都厲害”,或者“高分低能,成績優秀以外一無是處”的兩級印象,元年屬于通通透透的第三種:好玩就行,玩好就行,他既沒有投入專注的思維和技巧一定要“玩”出極致的水平,也不是笨拙呆板還負有 social 的精神壓力,

玩是人類的本質、天分、快樂與基礎,也是熱情、創造和想象力誕生的搖籃,不管是認真還是隨意,只要保持著輕松快樂的心態,得到精神的放松和愉悅,才對得起自己的人生,

生命長青,好玩至上,作業與休息都是,

????橙子說
看完北大博士的競賽體驗,你悟到了什么?
留言區聊聊啊~

? 拓展閱讀

作者|淘系技術

編輯|橙子君

出品|阿里巴巴新零售淘系技術

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/289652.html

標籤:其他

上一篇:Julia Computing獲得 2400 萬美元融資,前 Snowflake CEO 加入董事會

下一篇:立體視覺入門指南(5):雙相機標定【再不收藏我收費了~】

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more