2021年美賽C題目分析
2021年美國大學生數學建模競賽MCMC題目,為大資料類,
就本題而言,基礎演算法為二分類和Logistic回歸,
二分類用于資料的預處理
Logistic回歸用于資料的處理
美賽C題簡述(中文):




美賽C題目簡述(英文):
(轉自2021年MCM)




首先,分析給定的建模資料
1. 4440項的資料

Global ID
目標事件的ID標識,作為預處理和資料后期處理的重要基準
Detection Date
檢測日期
Notes
記錄者的筆記
Lab Status
對事件的可信度的劃分,由題意,分為3類:
1.確定的亞洲大黃蜂目擊事件
2.錯誤目擊事件
3.未確定事件
Submission Date
提交日期
Latitude、Longitude
記錄事件的位置(經緯度),作為分類的重要標準
2. 3305項的資料

簡要來說,就是4440次報告中,確定有媒體資訊的只有3305次資料,這樣就給后期的資料帶來一點復雜,
3. 生物屬性資料







略去后面 …
實驗資料的預處理
(僅供參考!)
根據兩個資料表的Golbal ID 將圖片與目擊事件資料集連接起來
構建圖片二分類訓練標簽
建立預測模型
進行優化
其中有幾點需要注意的點:
1.查找相關“生物類”文獻資料,建立大黃蜂的生殖模型
2.大黃蜂影像的分類
這里要說明的是,可以用Logistic回歸,根據生物屬性資料表,從翅膀,腿等等構建0-1回歸,根據資料的可信度,劃分界限(基本以0.5為主,也可0.4或者0.6),從而完成分類
3.根據資料表的經緯度,構建事件圖
(保證比賽公平公正,具體演算法和代碼賽后更新…)
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/257834.html
標籤:其他
下一篇:原碼, 反碼, 補碼 詳解
