我知道網上對于所謂阿三的外包問題一直是覺得特別簡直是low到極點,知乎上還有大佬專門diss印度外包,但是另一方面,從外包市場來說,像中國的頭部外包,姑且不說又貴又不好用,姑且不說英語不好所以不被美國用,我們再去掉所有政治因素,
如果公平比較,我覺得大部分大廠的大牛可能打不過印度的高年級本科生,
我來說說昨天發生了一件什么事情,我昨天聯系外包的時候,突然被一個印度的學生(本科生三年級),說想接點外包的活,來自于Indian Institute of Science,一直跟我聊說老板給個機會,一直跟我聊說老板給個機會,我最后煩得不行,我就說好吧,你今晚就給我做出來一道題,做出來我考慮,做不出來就別煩我了,
這道題是這樣的,
構建一個Vector Class類,實作Z=(A+B+C).reduce(Sum()).要求在CUDA中進行,僅僅進行一次回圈,并且reduce效率必須高,
我知道各位大佬可能會覺得這題簡單到了極點,但是,我隨時可以找幾個毛病就可以說你怎么這個都不知道,
- 比如說CRTP pattern,因為CUDA不支持動態多型,而且不是一般的復雜,參見Eigen設計
- Reduce在GPU上優化極難,參見優化reduce操作
- 除了這個以外,因為所有是async的,所以背后要用stream overlap資料傳輸和計算,
只要在任何一個小點上他出問題,我就可以把他屏蔽,而且當時我給他是我這里的夜里一點,
他做了一晚上,今天早上給我了,
都做到了,而且他很抱歉,沒法寫到更general,比如說自動調整stream數量,thread和block數量等等,他不知道怎么做,
各位大佬,這是一位印度top university大三的學生,軟通的如果我這么面試,請問能過幾個?各位CS專業的有幾個能達到這種程度?
總結一下,如果你僅僅看爛,一定這個世界上有比你爛的,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/244804.html
標籤:其他
