【編者按】疫情疫情給全球造成了不同程度的影響,美國每日新增病例一直以萬計數,而傳染性疾病的傳染和預測模型,在傳統的機器學習當中非常普遍,然而這次奪人眼球的不是大廠的模型或者醫學院的報告,而是一位 27 歲青年顧右洋(音譯,Youyang Gu)搞出來的預測模型,該專案和模型被放在了covid19-projections.com 網站上,模型得到了美國疾控中心的參考,受到了包括包括《華爾街日報》,《經濟學人》,《紐約時報》,《華盛頓郵報》,NPR,CNN 等媒體的報道,最重要的是,這個專案是他獨立完成的,沒有團隊,
作者 | 八寶粥
出品 | CSDN(id:CSDNnews)
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dVSkHa5a-1613990175467)(image/20210222_154052_66.png)]](https://img.uj5u.com/2021/02/24/227651241138531.png)
美國民眾也感受了一把 “研究機構的參差”
2020 年疫情爆發之后,全球對于此次疫情都較為關注,但是關于疫情走勢的論文寥寥無幾,只有國內幾家醫學院和醫院進行了資料采集和有效的文章報道,2020 年 3、4 月份,美國有兩大預測機構,一個是倫敦帝國理工,另一家是美國華盛頓大學健康指標和評估研究所(IHME),然而常在河邊走,這兩家機構的結果真的讓美國民眾感受到了“研究機構的參差”,
帝國理工提出警告,美國到 2020 年夏天將有 200 萬人死于疫情;而 IHME 則發出了保守的預測,表示到 2020 年 8 份死亡人數會達到 6 萬人,結果表明,八月初,美國有 16 萬人次死于疫情,這種“巧妙”避開了真實值量級的預測,令人失望,也讓 26 歲的顧同學決心利用自己的專長進行大資料預測,
2020 年 4 月,他建立了關于疫情的網站,沒有多久,該網站顯示的結果就被發現比擁有更多財力和人才的機構更加準確的結果,
2020 年 5 月下旬,顧同學在社交網路發布內容,宣布該網站一直是每周最精確的模型,甚至對于 5 月 16 日的死亡人數的誤差在萬分之一,『模型預計 5 月 16 日有 88767 人死亡,實際報告有88,751人死亡』
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-JxsSCd0c-1613990175473)(assets/markdown-img-paste-20210222174123596.png)]](https://img.uj5u.com/2021/02/24/227651241138532.png)
該模型預測能力在 2020 年 5 月幾乎成為了最優解,連楊立昆(Yann LeCun)大佬都連連稱贊:
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-juc0X0MU-1613990175479)(assets/markdown-img-paste-20210222172314698.png)]](https://img.uj5u.com/2021/02/24/227651241138533.png)
這種精度難免讓人懷疑他是不是發現了資料發布的規律或者搞到了預測的 Bug,話說回來,這也不是什么演算法比賽,而他所利用的資料也都是公開的資料,所以,這些大廠、機構預測不過人家少年,究竟是技不如人,還是存在人為控制,也不得而知,
但是顧同學確實發現了一些問題,最初在考慮住院人數、其他因素等關系的時候,發現各州和聯邦的結果不一致,因而選擇了“死亡人數”這樣一個更可靠的數值來進行衡量,依靠過去的死亡,預測未來的死亡,并將其作為唯一可以可以用來過濾噪聲的變數,
IHME 此前一直為美國當局大量參考,IHME 主管克里斯托弗·默里(Christopher Murray)曾表示,一旦該組織在 4 月以后更好地控制了該病毒,其預測就會大大改善, 試圖告訴人民死亡人數將在 7 月份清零,該做法不得不讓人懷疑這種預測可能受到了某種不可抗力的影響,也正是因為如此,其他機構通過大量因素參考得到的預測結果,就不可避免地比顧同學的模型多出了更多的噪聲,
4 月底 華盛頓大學著名生物學家卡爾·伯格斯特倫(Carl Bergstrom)在社交網路發布了關于顧同學模型的內容,而美國疾控中心也將該模型納入了預測網站,
為什么不做預測了?為什么又來了?
當顧同學看到其他機構的模型已經逐漸成熟和精確以來,覺得自己的作業已經完成了,準備停止專案了,專案停止前的 1 個月,對于 11 月的死亡人數依然有較高精度的預測,仿佛先天知道結果一般,
即使如此,依然有人在“酸”,比如 IHME 的默里就表示,顧同學的機器學習演算法能理解短期預測,但是不能理解“全域”,于此,顧同學沒做過多回應,而是感謝了默里等人做出的貢獻,深藏身與名,
當然,深藏身與名是不可能了,畢竟已經這么“火”了,
然后他又繼續在網站上開始自己的貢獻,因為疫苗的出現和群體免疫的提出,他開始在這些方面進行一系列的預測和定期資訊收集,研究物件也從美國個州個鎮到了世界各地,
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-A3ux7JhQ-1613990175495)(assets/markdown-img-paste-20210222183535474.png)]](https://img.uj5u.com/2021/02/24/227651241138534.png)
顧同學其人
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-5voqxSFW-1613990175498)(image/20210222_160144_64.png)]](https://img.uj5u.com/2021/02/24/227651241138535.png)
顧同學出生于中國上海,在伊利諾伊州長大,公開資訊顯示,顧同學擁有 MIT 電氣工程與計算機科學和數學雙學士、電氣工程與計算機科學碩士學位,在 MIT 的計算機科學與人工智能實驗室的自然語言處理小組完成了自己的論文,
此后他從事了金融行業,從事交易演算法作業,他的專案也只是在網站眾籌捐款,希望自己的資料不受任何利益沖突和偏見的影響,
最后以 Youyang 在社交媒體發布的內容結尾:
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ZmJmmFAb-1613990175574)(image/20210222_161242_48.png)]](https://img.uj5u.com/2021/02/24/227651241138536.png)
于我而言,年齡只是一個數字,進行批判性思考和適應新的資訊無需數十年的積累,作為局外人甚至是一種優勢,在這個資訊易得的數字時代,不要讓缺乏專業領域的知識阻礙你追求自己真正的興趣!
【參考資料】
https://www.linkedin.com/in/youyanggu/
https://www.bloomberg.com/news/articles/2021-02-19/covid-pandemic-how-youyang-gu-used-ai-and-data-to-make-most-accurate-prediction
https://covid19-projections.com/about/
https://youyanggu.com/about
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/263026.html
標籤:AI
