主頁 >  其他 > 2021年美賽c題F獎論文分塊講解&建模歷程

2021年美賽c題F獎論文分塊講解&建模歷程

2021-04-29 11:45:16 其他

先上證書:

剛看了下我們小群的歷史訊息,居然大半都是類似于“干飯干飯”這樣()

我們隊是在美賽前重組的,(之前和kana醬是同一組,同組男隊員實在太拉了,不管性格還是能力).

三人實戰經驗無い,指導老師組織模擬過三次,我和小劉是氣象學的同班同學.

小劉年級前1%,kana醬是計算機學院的年級前1%,我:(平平無奇二次元)

我們之前在不同組,國賽都拿了省三

小劉想靠美賽加分保研,kana醬和我一直沒拿到什么耀眼的成績,想在本科最后一次數模比賽中出一口惡氣.

小劉之前做A題多一些,沒碰過統計,我和kana一直選c但沒做出什么成績,嚴重缺乏自信心,所以出成績第二天,剛起床,看到拿了Finalist(震驚)(不是眼花了吧.jpg)

然后開始分析題目和講一下我們的解題方法和思路吧!

第一問:預測有害生物隨時間的傳播和準確度

(這題是小劉做的,我來簡要闡述)

隨時間傳播,必然要考慮到空間上和數量上,小劉選用(48.5N°-49.5N°, 123.5W°-121.5W°) 用于后續分析和預測,考慮到胡蜂分布與巢位密切相關,用NAA(Predict the range of activity from original nest to new nest)模型來定位巢穴并預測蜂的活動范圍,兼并考慮華盛頓州的地形作用,來改進原有NAA模型,并構建誤差矩陣來計算準確性和靈敏度.我則使用了基于資訊擴散和人口增長的Fick-logistic擴散模型來解決數量增長問題.

NAA模型基本思路:對空間進行離散處理后,基于往年胡蜂位置的歷史資料,以及胡蜂覓食的特性,構建胡蜂出現概率p與位置離散點的分段函式p(i,j),然后通過聚類演算法將空間點分為兩類,自然,p較大的一類的空間點即為nest可能出現的位置,個數即為預計的巢穴位置的總數,

同時引入queen的經驗建巢距離,以達成根據方程組預測新巢位置的目的.同時考慮到一般覓食在2km以內,為了增加2km范圍內黃蜂出現概率,對公式加入訂正因子.

最后得到的結果也很好,預測范圍包含所有實測范圍!且預測其主要向東南方向擴散,但考慮地形,華盛頓州西部有大片林地,有利于Asian giant hornets 筑巢繁衍,所以其更有可能向南進一步擴散,

最終構建的方程組如下:(另外,推薦在建模的程序中由簡入繁,從模型簡單到復雜完善化的程序全部po在論文上,這樣看起來思路完整)

構建誤差矩陣計算準確性的程序比較基礎,如下,不再贅述:

數量預測方面(我做的):

基于胡蜂的種群數量動態特征,將胡蜂的數量增長分為兩類:某蜂群內部的受精繁殖程序稱為“內部增長”,將不同的兩個群落之間互相影響而相互受精繁殖的程序稱為“外部增長”,再耦合:

  • logistic 模型——自然狀況下的,種內競爭加劇,的世代重疊的連續種群增長模型

  • Fick 擴散模型——“菲克第二定律”:在物理學中,“擴散”是指某種物質分子通過一 個濃度梯度或濃度差異移動的現象,即物質分子由高濃度區域移至低濃度區域,至分子均勻分布為止 .

生成關于種群密度的,兩種模型的混合模型,以偏微分方程組的形式,再設定初邊界條件,以求解偏微分方程.

可圈可點的是,我使用了數值模擬生物實驗的程序以得到華盛頓州內胡蜂種群密度,因為美國于 2020 年九月份于加拿大不列顛哥倫比亞省溫哥華島(49°23‘𝑁, 123°06′𝑊) 第一次發現了胡蜂巢,故以此為源點,且時間序列從 2020 年九月開始統計胡蜂的出現量.

在如下引數設定下進行了蒙特卡洛數值模擬仿真實驗:

  1. 初始密度𝜙(𝑥, 0):由開始傳播前的密度估計量所決定. 𝜙(𝑥, 0) = 8.231

  2. 內部繁殖率 r:根據已經確定的引數與混合模型,對 r 進行多次擬合,得到

    r=0.02735(with 95% confidence bounds (0.0265,0.0282))

  3. 環 境 所 能 容 納 的 最 大 限 度 N:N=42.34(with 95% confidence bounds

    (11.26,73.84)).

  4. 外部增長率 d:其反應任意兩個蜂群之間的互相繁殖增長率,因為隨著時間的

    推移,群體與群體之間繁殖擴散的程度會逐漸趨于均勻,即外部引數是看作 時間 t 的遞減函式,如下等式所定義:

    𝑑(𝑡) =1.4𝑒J<.K(LJ<) + 0.25

根據上述引數設定,對胡蜂群落的增長程序進行了數值仿真模擬, 并改變傳播引數模 擬美國 2020 年 10 月下半月進行的清剿巢穴活動對種群密度的影響作用.執行仿真 程序的步驟如下:

1. 輸入初始引數(與估計出的 2019 年 9 月種群密度一致),時間上限設為 400 天,設定仿真計數引數為1

2. 計算 t=i+1 時的種群密度,更新 N(t)并記錄

3. 重復執行步驟 2,直到到達清剿巢穴活動開始的時間點(i=375)

4. 清剿巢穴的作用不但在于直接減少種群密度,還在于削減了不同蜂群之間的交流繁殖,對外部增長率 d 有明顯衰減作用.減少 d 來模擬此程序. 5. 重復計算 t=i+1 時的種群密度,更新𝜙(t)并記錄,直到達到仿真上限時間.

不同增長率的數值仿真結果

可以看出,政府若不實行清剿行動,每 15 天蜂群密度擴張將呈現指數型增長.

然后計算預測準確率的評價函式,通過三次樣條將資料插值,得到不 同時間對應不同距離上種群密度的預測準確率情況(結果不錯):

至此,第一問結束.

可以改進的部分:

我是學氣象的啊啊啊,一定是專業課沒學好的緣故,當時沒有想到暖濕氣流對胡蜂的分布狀況也具有影響(冬季,胡蜂對暖濕的地區具有傾向性,可以在NAA以及數量擴散加入影響因子),如果考慮了過落基山的風速風向以及下沉氣流是焚風還是布拉風,只需要下載NCEP資料,截出美國的經緯度矩陣...再做一點中尺度的分析,總體上來說一定更完備.

寫得太慢了還復不復習考研了()

準備把第二三四放在一起寫:(這三題是我和kana醬一起做的)

第二問:利用影像集和文本資料集,對胡蜂進行分類,分析準確性

第三問:用訓練好的分類模型分類unverified和unprocessed(其實就是應用以及建立好的模型分類未知資料)

第四問:在有新報告加入的情況下更新分類模型

我先對影像和comments資料進行了清洗和處理,將影像全部整理成jpg格式(matlab程式批處理,個別自己手動調的),并洗掉了detection date中的亂碼日期和1980年的資訊條,隱藏了submission date.然后在一本關于影像處理的古籍上看到了影像配準的黑科技,它可以處理影像的扭曲變形,輸入一張標準參考影像,可以使得未經處理的影像與標準影像視角一致,有利于后期影像的量化,效果如下:

然后kana醬學過影像處理,就交給她量化了....!

她運用了主成分分析,得到四個主成分:顏色成分,圖片目標清晰度成分,位置資訊,notes情感色彩成分,以便農業部在進行篩選時著重注意以上四點.

然后整理出了用于分類的訓練資料集,格式如下:

構建貝葉斯分類器(機器學習那一卦的,python直接調包),第二題用十折交叉驗證(Bayes包里的一句命令)算準確率(68%)和召回率(93%)

第三題:Classification of unverified and unprocessed events

也許因為指標多,資料充足,樸素貝葉斯分類器分類性能很好,結果分出七個陽性.

第四題,一種基于賦權淘汰更新機制的集成分類器

將訓練資料分為等大的單位資料塊,每個資料塊中包含數量相同的樣本資料. 集成分類,對基分類器實作動態更新和為基分類器分配合適的權重,即集成分類器的動態 迭代更新,可以在此基礎上提出一個加權函式,對具有不同引數特征的資料流進行有針對 性的獲得基分類器的最佳權重,從而提升集成分類器的整體性能.

簡單的說,就是選一個性能較好的傳統分類器,比如NB,SVM什么的,對默認引數進行調整,整合出適合我們自己的基分類器(馬克思中國化(什)),綜合所有原因,且基于風險最小化的 SVM 對小資料量分類很友好,由上分析,最終選用 SVM 分類演算法.

對下一個到來的資料塊,先利用集成分類器{𝐸#, 𝐸%, 𝐸&, ... , 𝐸(}對每個資料分類,得到新 資料塊的分類準確率,將舊基分類器的準確率與新分類器的進行比較,淘汰掉效果不好的基分類器.

初始權重全定義為1,有資料塊投入后將分錯率的倒數作為基分類器的權重. 將所有分類結果進行加權平均作為集成模型的最終結果,若有新報告被提交,則在累積夠一個數

據塊所包含的最佳樣本數后,聚成一個資料塊投入集成分類器,后通過比較當前模型中各 集成分類器的分類準確率與此前已完成分類的資料塊來進行模型更新,淘汰掉已經不適 應現有資料概念的基分類器.

思想大致如上,至于最佳樣本數,毋庸置疑,可以用來解釋時效性,于是我們運行模型,討論每次引進的資料塊中所含提交報告數 n 對分類器性能的影響(即控制引數查看結果,相當于敏感性實驗)

不同資料塊中所含提交報告對集成分類器的性能的影響

由表清晰可得當每次輸入的新資料塊中含有 25 個資訊條時模型效果最好,即每次額外的新報告累積達到 25 條時,聚成一個資料塊投入分類器,此時集成分類器具有較高的分類準確率和較好的性能.即更新的頻率為每 25 條提交報告更新一次分類模型.第四題至此結束!

可以改進的部分

是在短期氣候預測課上想到的,可以使用泰勒圖(Taylor diagram)來選取最優基分類器,其氣象應用是可以通過一張圖直觀衡量不同模式和真實觀測結果之間擬合程度,精度指標有相關系數,標準差以及均方根誤差(RMSE),可以依此來選出最佳模式.同理,可以用此圖來選擇最佳基分類器,如下:

泰勒圖
我們在論文所使用的演算法比較圖

第五題明早專業英語課上寫.....已經錯過飯點了嗚; ;

第五題:給出可以確定胡蜂在華盛頓州滅絕的證據

為了確定一個物種的滅絕,最有效與常用的手段就是持續檢測,監測時間的長短極大地影響了結果,時間過短,有可能造成“遺漏”,從而種群又重新增長起來;時間過長,又可能造成人力物力的浪費,所以需要合理的評價物種滅絕的模型來對二者進行權衡.

REA(Rapid eradication assessment快速根除估計)模型經常被用來評價一個物種被滅絕的可能性,因為構建檢測網格在線上無法實作(數值模擬大約需要很多計算資源以及復雜的方程式,我們不是此專業并不了解),所以我們參考了兩篇經濟學報文章:有關一次島嶼上的田鼠滅除記錄的資料,我們更多地監測可能來自于群眾的目擊,因此,我們僅借用REA中的Bayesian logic 來確定在無目擊情況下物種消除成功的條件概率P(success | no detection),構建P(success | no detection),與P(detection)t ( 在時間t至少發現一只 Asian giant hornet的概率)之間的關系式,從而,用描述民眾目擊到的胡蜂個數來判斷胡蜂是否已被根除.

我們對P(detection)t取不同值進行模擬,選取時的臨界值作為判斷the eradication of vespa mandarinia的第一判據;

得到在不同發現概率的情況下所對應的根除成功率:

結果:顯然,當發現胡蜂的概率為0.013時,其確認滅除成功概率隨時間顯著遞增:

為此我們提出了判斷the eradication of vespa mandarinia的第一判據:一年中在華盛頓州發現Asian giant hornets的概率應小于0.013,即:每有1000個detetions,最終被證實存在Asian giant hornets的detection的數目應不超過13,

第二判據則參考實際情況,如果發現的是一只落單的胡蜂,但卻將其計入P_detection是不準確的,所以給出判斷此是否是一只落單胡蜂的判據二:

根據胡蜂的習性,它不會在距離巢穴八公里之外的地方覓食,以8km為半徑則以16km為直徑,那在其周圍的16km內若沒有發現其余的Asian giant hornet,我們可以近似認為這只Asian giant hornet是“被遺漏”的個體,且不具備繁殖能力,示意圖如下:

并以第二判據為基礎來修正第一判據.

綜合以上兩個判據提出最終的判別標準:

若公眾在一年以內觀察胡蜂出現概率,若其檢測概率小于1.3%(在95%置信區間下),且其周圍16km內均無發現新胡蜂,綜上兩者,可以順利地證明華盛頓州政府已經把有害生物的數量減少到一個安全的水平,政府可以公開宣布有害生物已經被徹底消滅,

至此,第五題結束.

總的來說,我覺得能拿到F的原因在于我們隊的論文有如下優點:

1.完整解決了題目中給出的問題

2.基于實用的角度和目標來著手做&回答問題

比如,在memo中插入了便于政府理解的圖片,以及在進行分類時顯著的分類特征:

即把題目當作正在解決的問題,以利于方便政府去著手處理的角度去寫論文.

3.學點機器學習(簡單又好用,直接調包大勝利)

可以找一些比較古老的書,里面說不定會有黑科技(比如影像配準)

4.最重要的,有靠譜的好隊友.

OVER~~!

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/281249.html

標籤:其他

上一篇:你不想成長,生活總會逼著你成長,阿里P8架構師分享十年學習生涯

下一篇:干貨|龍芯智龍平臺和RT-Thread系統

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more