文章目錄
- 下載鏈接
- 問題C:確認黃蜂的嗡嗡聲
- 思路分析
下載鏈接
2021美賽題目下載:鏈接:https://pan.baidu.com/s/1yFdg3vBMS4MY7CnQ3PMG9Q
提取碼:6666
2021立方米
問題C:確認黃蜂的嗡嗡聲
在2019年9月,在加拿大不列顛哥倫比亞省溫哥華島發現了一群(又稱亞洲巨型馬蜂,
巢迅速被摧毀,但事件的訊息迅速傳遍了整個地區,自那時以來,在鄰近的華盛頓州
發生了幾起確認的害蟲目擊事件,以及大量的錯誤目擊事件,有關探測圖、馬蜂手表
和公眾視線,請參見下面的圖1,

圖1:描繪亞洲巨蜂探測的地圖,以及大黃蜂觀察和公共地點,

馬蜂是世界上最大的馬蜂種,巢的發生令人震驚,此外,巨蜂是歐洲蜜蜂的捕食者,入侵和摧毀它們的巢穴,少數大黃蜂能夠在短時間內摧毀整個歐洲蜜蜂群,同時,它們是其他昆蟲的貪婪捕食者,被認為是農業害蟲,這種馬蜂的生命周期與許多其他黃蜂相似,受精的蜂王在春天出現,開始了一個新的殖民地,秋天,新王后離開巢穴,將在土壤中度過冬天,等待春天,一位新女王的范圍估計為30公里,以建立她的巢穴,關于亞洲大黃蜂的更詳細資訊包括在問題附件中,也可以在網上找到,由于對當地蜜蜂種群的潛在嚴重影響,的存在會引起大量的焦慮,華盛頓州建立了熱線和一個網站,供人們報告看到這些大黃蜂的情況,根據這些來自公眾的報告,國家必須決定如何優先考慮其有限的資源,以跟進更多的調查,雖然一些報道被確定為蟲,但許多其他目擊事件被證明是其他型別的昆蟲,這個問題的主要問題是“我們如何解釋公共報告提供的資料?”和“在政府機構資源有限的情況下,我們可以使用什么策略來優先考慮這些公共報告進行額外的調查?”你的論文應該探討和解決以下幾個方面:
- 處理和討論是否可以預測這種害蟲隨著時間的推移而傳播,以及具有什么樣的精度,
- 大多數報道的目擊事件都把其他黃蜂誤認為是馬蜂俠,只使用提供的資料集檔案和(可能)提供的影像檔案來創建、分析和討論預測錯誤分類可能性的模型,
- 使用您的模型來討論您的分類分析如何導致優先調查報告最有可能是積極的發現,
- 解決如何更新您的模型,給定更多的新報告隨著時間的推移,以及更新應該發生的頻率,
- 使用你的模型,什么將構成證據表明害蟲已經在華盛頓州被根除?最后,你的報告應該包括一個兩頁的備忘錄,總結你的結果給華盛頓州農業部,您的PDF解決方案不超過25頁,應包括:
- 一頁匯總表,
- 目錄,
- 你的解決方案,
- 兩頁備忘錄,
- 參考資料清單,
注:MCM比賽現在有25頁的限制,您提交的所有方面都計算到25頁的限制(摘要表、目錄、參考串列和任何附錄),
您不應使用未經授權的影像和材料,其使用受到著作權法的限制,確保你參考你的想法的來源和你的報告中使用的材料,問題C的一般準則除了上面列出的具體要求外,請記住這是一個統計建模練習,提交的材料應遵守與使用資料有關的最佳做法,這些期望的一些例子包括但不限于以下方面:- 定義您使用的所有度量和成本函式,
- 引數的任何估計都應包括區間估計,
- 任何結果都應包括對結果的擬合優度的估計,
- 所有假設都應明確說明,特別是與資料或錯誤相關的分布,
- 應檢查與資料有關的所有假設,并檢查技術對這些假設的穩健性,
- 與一種方法或技術有關的所有假設都應清楚地說明,附件我們為這個問題提供以下四種材料,提供的資料檔案包含您應該用于此問題的唯一資料,
- 2021MCM_ProblemC_Vespamandarinia.pdf
來自賓夕法尼亞州立大學分校的背景資訊,描述了這種昆蟲, - 2021MCM_ProblemC_DataSet.xlsx
具有以下欄位的4440個目擊報告的電子表格:
全域ID:每個觀察記錄的唯一標簽,
探測日期:探測的報告日期,
注:報告提交人提供的意見,這可以是公眾的成員,也可以偶爾是州雇員,實驗室狀況:由國家農業部分析后對視力進行官方分類,陽性ID意味著它被確認為亞洲巨蜂,否定ID意味著它被排除在外,未處理意味著它尚未被分類,未經核實意味著由于缺乏資訊,沒有作出任何決定,
實驗室點評:州昆蟲學實驗室分析后添加到記錄中的內容,
提交日期:向國家提交報告的日期,此日期可以在檢測日期之后顯著,
緯度(optioning):這些資料在轉換報告提供的地址后由國家提供,
經度(視線):這些資料是由國家在轉換報告提供的地址后提供的, - 2021MCM_ProblemC_Files.rar
一個帶有3305張圖片的rar檔案,與目擊報告一起提交,
可從:下載662MB檔案:
http://www.comapmath.com/MCMICM/2021MCM_ProblemC_Files.rar 打
開檔案需要一個密碼:Af6SP7rdm33PxPJmDb4wZq7cw - 2021MCM ProblemC_Images_by_GlobalID.xlsx
用以下欄位將影像映射到瞄準鏡的電子表格:
檔案名:rar檔案夾中影像的名稱,
全域ID:每個觀察記錄的唯一標簽,這在兩個電子表格中是一致的,
檔案型別:影像以.jpg、.pdf、.png、.jfif、八進制流、xml打開格式或.zip
檔案的形式到達,視頻以.mp4或快速時間檔案的形式到達,
參考資料 - 華盛頓州農業部,2020亞洲巨型大黃蜂公共儀表板,
https://agr.wa.gov/departments/insects-pests-andweeds/
insects/hornets/data訪問11/5/2020,思路分析
問題中心:對excel資料進行時空預測、對圖片資料進行黃蜂分類,需要深度學習基礎(個人感覺傳統模型對預測、分類結果的真確率、召回率、解釋性說服力不強,但仍然可以建模),
簡要思路:大資料問題,首先花時間了解附件資料,探索性分析,通過簡單的擬合預測性的給出模型的建立方向以及答案,
個人的習慣是大資料問題第四章單獨寫資料清洗,具體流程看群中研究生數模的國獎論文,
首先要分析三個附件,提取有用的變數、洗掉欄位缺失的資料條、分類變數歸一化等,進一步處理等待更新,
(1)預測模型
討論分析大黃蜂的出現量隨時間的變化、創新點:考慮空間分布的差異,
(2)分類模型
訓練影像分類模型,模型需要構建深度學習框架,對有深度學習基礎的同學來講并不難,給出常用的建模指標即可求解,創新點在于分析召回率、正確率等的空間特性,
(3)模型評價
預測(LSTM、RNN、ARIMA、MLR、SVR)、分類(CNN、SVM、決策樹)的結果是否有利于總結建設性建議,如何提升結果對建議的有效性?
(4)模型優化
解釋模型的更新機制、復雜度、時效性、不同區域的適用性等,
(5)建議方案
給出黃蜂數量減少至認定的安全范圍的證據
該問題相對較難,大資料問題雖有吸引力,但因為文本資料門檻較關鍵,對于沒有資料分析高階經驗的同學可能難以做出成果,慎重考慮,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/257047.html
標籤:AI
上一篇:2021美賽A題翻譯(僅供參考)
