賽題思路 完結
- 0引言
- 1、資料處理讀入
- 2、賽題分析
- 2.1問題一
- 2.2問題二
- 2.3問題三
- 3、代碼資源
- 3.1問題一代碼資源
- 3.2問題二代碼資源
- 3.3華中杯A題資源合集
0引言
華中杯賽題已于2021年4月30日(今天)晚上20:00發布,下面是發布網址,大家感興趣的可以下載查看交流,
今晚(2021年4月30)看了看A題,感徑訓行,因為自己這次沒參加,就尋思著從建模手和編程手的角度寫份思路把,大家有更好的想法和處理技識訓迎再評論區積極留言呀,
本文思路使用的軟體是R語言3.6.3版本,編程語言不重要,關鍵是處理思路,其實大部分作業excel就可以解決,低年級的同學不用太過糾結,
思路會持續更新三天,大家可以關注收藏呀,
1、資料處理讀入
資料總共有如下五份,兩份輸出格式資料"result1.txt" "result2.txt"告訴你結果應該以啥格式輸出,兩份需求資料"附件2:影像1顏色串列.txt" "附件3:影像2顏色串列.txt"給出了規格為216和200的兩份資料,資料資訊包含,序號和RGB,
> Txt <- list.files(path = ".", pattern = "txt")
> Txt
[1] "result1.txt" "result2.txt" "附件2:影像1顏色串列.txt" "附件3:影像2顏色串列.txt"
[5] "附件5.txt"
最后一份資料"附件5.txt"是我自己整理的,是把下面的資料:

整理成下面的資料格式讀入R語言,
> fig3 <- read.csv(Txt[5], header = T, encoding = "UTF-8")
> fig3
R G B
1 0 0 0
2 255 255 255
3 255 0 0
4 246 232 9
5 72 176 64
6 27 115 186
7 53 118 84
8 244 181 208
9 255 145 0
10 177 125 85
11 92 59 144
12 11 222 222
13 228 0 130
14 255 218 32
15 118 238 0
16 17 168 226
17 255 110 0
18 201 202 202
19 255 249 177
20 179 226 242
21 249 225 214
22 186 149 195
需求資料經過處理匯入R語言如下:
> fig1 <- read.csv(Txt[3], header = T, encoding = "UTF-8")
> data.table(fig1)
s R G B
1: 1 0 20 39
2: 2 0 20 82
3: 3 0 20 125
4: 4 0 20 168
5: 5 0 20 211
---
212: 212 215 235 82
213: 213 215 235 125
214: 214 215 235 168
215: 215 215 235 211
216: 216 215 235 254
> fig2 <- read.csv(Txt[4], header = T, encoding = "UTF-8")
> data.table(fig2)
S R G B
1: 1 1 253 203
2: 2 2 232 102
3: 3 4 82 157
4: 4 4 101 180
5: 5 5 155 54
---
196: 196 248 191 234
197: 197 250 131 201
198: 198 251 39 131
199: 199 254 18 84
200: 200 254 135 7
2、賽題分析
下面是原賽題的三個要求:
1)附件 2 是影像 1 中的 216 種顏色,附件 3 是影像 2 中的 200 種顏色,請找出與每種顏色最接近的瓷磚顏色,將選出的瓷磚顏色的編號按照附件 4 的要求輸出至結果檔案,
2)如果該廠技術革新,計劃研發新顏色的瓷磚,那么,不考慮研發難度,只考慮到拼接影像的表現力,應該優先增加哪些顏色的瓷磚?當同時增加 1 種顏色、同時增加 2 種顏色、……、同時增加 10 種顏色時,分別給出對應顏色的 RGB 編碼值,
3)如果研發一種新顏色瓷磚的成本是相同的,與顏色本身無關,那么,綜合考慮成本和表現效果,你們建議新增哪幾種顏色,說明理由并給出對應的RGB 編碼值,
2.1問題一
思路探索:,再第一部分已經對資料進行讀取,再給出第一部分思路之前對已有的資料進行資料可視化,一遍尋找解題思路,
已有色系22:

圖片1 216

圖片2 200

我們第一問的認為是把現有的資料集合216和200每一個顏色和瓷磚顏色22中找出最接近的顏色匹配,我們假設顏色是關于RGB連續漸變的,且認為兩個顏色RGB的空間位置接近即可認定顏色接近,給出以下思路,
針對問題一,尋找演算法準則,為兩組需求資料自動對應顏色,換句話說根據RGB資訊自動匹配相近的顏色,假設把RGB看成空間的坐標,我們可以定義不同的距離來衡量需求資料中的每一個點和已有22組顏色的距離,尋找距離最短的記為最相似,最后可視化出自動匹配的效果,常用的距離有馬氏距離、歐氏距離、以及相似余弦等;
下面是以歐式距離為例做出的兩組判別圖(左:判斷 右:原色),


> data.table(序號 = 1:216, 選擇顏色塊 = w)
序號 選擇顏色塊
1: 1 1
2: 2 1
3: 3 11
4: 4 6
5: 5 6
---
212: 212 14
213: 213 19
214: 214 19
215: 215 21
216: 216 20
> data.table(序號 = 1:200, 選擇顏色塊 = w2)
序號 選擇顏色塊
1: 1 12
2: 2 5
3: 3 6
4: 4 6
5: 5 7
---
196: 196 8
197: 197 8
198: 198 13
199: 199 13
200: 200 9
2.2問題二
如果該廠技術革新,計劃研發新顏色的瓷磚,那么,不考慮研發難度,只考慮到拼接影像的表現力,應該優先增加哪些顏色的瓷磚?當同時增加 1 種顏色、同時增加 2 種顏色、……、同時增加 10 種顏色時,分別給出對應顏色的 RGB 編碼值,
問題探索:
因為顯示生活中顏色種類要比我們瓷磚的顏色多很多,所以需要開發新顏色,更方便我們尋找接近的顏色,增加圖型的表現力,
問題二而是個優化問題:我們可以從以下角度來對顏色進行選擇,一個是需求側:可以統計哪一個段RGB段的顏色出現需求比較高,一個是供給側,看22種已有顏色的分配是否均勻,
以上我們把題目給定的資料進行了平面可視化,但是沒有看出顏色的空間分布,我們只有知道了空間分布才可以確定以那種思路來添加新的顏色,
下面是兩個附件的空間顏色分布圖(左 216 右 200),

下面22個顏色的已有瓷磚,

我們可以看出圖一216顏色是有規律的等間隔采集資料,針對這種資料我們可以假設只有使得備選顏色盡量均勻分布再整個空間才能是的顏色的覆寫率達到最大,表現效果更好,想再原有的資料中添加資料,需要先統計研究原有資料的分布,是添加之后的資料更加均勻即可,
下面畫出22個資料RGB的統計條形圖,

圖中可以清晰的看出RGB并不是均勻的分布再整個空間中的,下面我們利用貪心演算法的原理,優先填補間隔最大的位置,
可以得到新的RGB坐標為:
> R_G_B(R)
[1] 147
> R_G_B(G)
[1] 29
> R_G_B(B)
[1] 107
依然畫出圖看一下效果:

可以看出效果還是可以的,但是我們需要再空間中看到添加到了什么位置,

這是使用貪心演算法的原則添加了20個點,下面是具體RGB坐標,上圖中左紅色就新添加的點,右圖是添加之后的點,
> data.table(new)
R G B
1: 147 29 107
2: 162 84 160
3: 132 44 48
4: 214 14 20
5: 40 97 118
6: 105 71 96
7: 82 191 74
8: 62 135 168
9: 236 158 40
10: 139 210 56
11: 154 21 152
12: 169 36 234
13: 193 51 137
14: 125 7 248
15: 221 77 26
16: 33 90 124
17: 46 103 14
18: 98 65 90
19: 111 196 101
20: 207 243 112
除了這種方法外,大家還可以使用選址模型、最大覆寫模型等演算法來進行新的RGB的選擇,
2.3問題三
如果研發一種新顏色瓷磚的成本是相同的,與顏色本身無關,那么,綜合考慮成本和表現效果,你們建議新增哪幾種顏色,說明理由并給出對應的RGB 編碼值,
這一問是對第一問和第二問的應用,所以不需要新的模型,這里只給出簡單的思路,不在給出實際代碼了,
對于增強圖型表現力的單目標問題來說肯定是顏色越豐富表現力越強,但是因為時間管理成本、開發成本不能夠這么干,所以我們應該提高顏色的利用率,建議定義如下指標:
- 已有顏色的對整個顏色空間的
覆寫率,每增加一個,覆寫率越高,但是覆寫率的增加速率會變慢,所有個數臨界值可以選擇每增加一個顏色顏色覆寫率變慢時的顏色個數, - 第一問中我們針對每一個顏色都選擇距離最近的顏色編號,同時我認為所有顏色資料和對應編號之前的
距離(絕對或者相對距離都可)也是一個不錯的指標,
3、代碼資源
本文的代碼都是使用R寫的,不會使用R的同學嚴禁購買,
正文已更完,大家有新想法的歡迎評論區指出,本文涉及代碼資源再今晚(2021年5月11)之前會慢慢發布,我會注明內容大家按需下載,
3.1問題一代碼資源
后臺很多私信要代碼的,一一回復太麻煩,這里統一上傳建立鏈接,大家可能沒有C幣,充值不合算我這里上傳的是用RMB下載的,這里是第一問的代碼資料,感興趣的可以下載參考,

3.2問題二代碼資源
如果下載過問題一的可以直接下載這部分資源,這里是第二問的代碼資料,
內容如下:

3.3華中杯A題資源合集
大家也可以直接下載兩問的合集:

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/282293.html
標籤:其他
下一篇:2021雙非上岸
