題概述
以音樂為主題的圖建模問題,可能需要一定的圖演算法(運籌、圖神經網路)、圖資料庫(Neo4.j、Nosql、Graph等)、知識圖譜(這塊不算很了解只能算感覺)的基礎才能很好將問題落地
問題背景
許多歌曲都有相似的旋律,許多藝術家對音樂流派的重大轉變做出了貢獻,有時,這些變化 是由于一位藝術家影響了另一位藝術家,有時,它是對外部事件(如重大世界事件或技術進 步)的回應而出現的變化,
希望團隊開發一種衡量音樂 影響力的模型,這個問題要求你考察藝術家和流派的進化和革命趨勢,
需要滿足的需求
向ICM協會寫一份一頁紙的檔案,說明使用您的方法通過網路理解音樂影響的價值,考慮到這兩個問題資料集僅限于某些型別,然后又針對這兩個資料集共有的藝術家,您的作品或解決方案將如何隨著更多或更豐富的資料而發生變化?建議進一步研究音樂及其對文化的影響,來自音樂,歷史,社會科學,技術和數學領域的跨學科,多元化的ICM協會期待您的最終報告,
一開始看題還以為給的是音頻檔案,這個就有意思了,后來仔細一看發現直接給csv了,那直接就成資料分析題了,換個背景罷了,前三問主要就是分析一個相似度,建立一個相似度的指標就可以解決問題了,相似度有很多東西可以來衡量,比如聚類之后做個樣本距離等等,也可以自己整合一個綜合一些的評價方法,資料分析最重要的首先就是特征工程,做好特征工程之后大問題就解決了,剩下就是語文建模與藝術建模了(重點,沒錯,美賽就是藝術建模,又沒標準答案,比國賽簡單多了)
相似度建模具體可能會用到:歐幾里得距離,皮爾遜相關系數, Tanimoto系數等等,可以參考這篇文章:
https://blog.csdn.net/weixin_39050022/article/details/80732249
== 各問題具體參考思路更新:(僅供參考)==
1.此題僅需要influence資料集即可,如果有能力可以在這里建立一個知識圖譜,實際此題的目的是為了確定藝術家的音樂影響力,而建立所需要的定向網路就是讓influence中的影響者藝我給出的方法是首先添加資料列音樂領域始祖,也就是對所有資料進行溯源,如果追隨者和影響者的領域相同,找出影響者是追隨哪個影響者的,這個需要代碼實作,添加資料列影響人數對于某一確定的影響者,找到被此影響者直接或間接影響的人數,做出領域人數表,計算出領域內的藝術家大師共有多少人,在相同領域,可以根據不同年份做可視化(折線圖最好),觀察并得出不同領域的巔峰年份(新生代人才最多的),
這時,子網路引數就算建立好了,然后建立misic influence模型,可以建立綜合評價模型(有很多,選擇其一),這里選用灰色綜合評價法,指標為此藝術家的影響人數,所在領域人數所在領域年份人數所在領域年份影響力排名(計算方法為:先篩選出藝術家所在領域此年份的所有人,然后根據影響人數進行排名),所在年份競爭力(這一年份的所有領域的藝術家總人數),(對于模型的求解程序,在論文中以一個領域的一個年份進行展示即可)
2.這里選用FULL_MUSIC_DATA資料集和第一問用到的資料集進行分析,題目的要求是開發音樂相似性度量模型,并判斷是否流派內的藝術家比流派間的藝術家更相似,由于指標很多,可以利用兩種方法進行處理,1可以利用相關分析探究各指標與受歡迎程度之間的相關關系,將相關性低的幾個指標剔除,2可以利用主成分分析對資料進行降維對于音樂相似性度量模型,需要用到FULL_MUSIC_DATA資料集,關于如何處理資料集在文未附1,音樂相似性主要指的是兩個音樂之間的相似程度,再對資料集進行資料清洗之后,可以用代碼計算出音樂間的相似程度,常用皮爾遜相關系數和余弦相似度,除此之外,可以對其進行可視化,畫出相關關系熱力圖,可以直觀反映音樂間的相似性,針對后一問,根據藝術家所屬流派,對于藝術家進行聚類分析(DBSCAN或者kmeans)查看流派內的藝術家與流派見的藝術家的相關關系,聚類分析展示出的圖(不同流派用不同顏色的點)可以直觀反映流派間與流派內的關系,
3.對于流派是如何隨著時間的推移而變化的,可以針對某,流派進行闡述,第一問介紹了時間推移此領域的新生代人數,除此之外也可以看這一領域此年份的發歌量,可以做折線圖來看個流派的興衰,然后根據一些重要的時間節點,比如拐點或者增長率很高或很低的節點,查看FULL_MUSIC_DATA資料集中對應的時間內,此領域或者樂壇發生了什么變化,是否有很著名的歌曲,或者由于別的領域火熱,導致此領域人數,歌曲變少了,這里可以自行發揮,語文建模大家都很擅長針對有些流派與其他流派是否有關聯,可以看同一藝術家是否在不同流派發表了歌曲,或者不同藝術家之間的影響關系Influence_Data資料集,
4.前半問需要大家發動自己的智慧,只要扯上關系證明真的會影響即可,對于后半問,可以針對性地做驗證分析,某些音樂特征比其他特征更具“感染力”,可以參考前說的相關性分析,也就是在FULL_MUSIC_DATA資料集中利用相關分析探究各指標與受歡迎程度之間的相關關系,相關性更高,表示更有感染力,它們在影響某個特定藝術家的音樂方面都扮演著相似的角色,這個可以對一個有名的藝術家進行探討,針對不同的指標,查看影響者與被影響者之間指標的相似程度,可以搞一個對比圖、南丁格爾玫瑰圖或者雷達圖(后兩個更好一點,在進階思路中給出畫的軟體和方法),最后進行資料分析,
5.這個在前面的分析中說到了,就是觀察折線圖的拐點或者增長率很高或很低的節點,后針對這一節點,分析為什么會出現這樣的情況,將這一時期的藝術家和作品都列出來,查看作品的各個指標有什么比較突出的特點(突出不突出,就和所有作品的平均值做對比,與平均值差距很大則代表很突出),這樣的特點就是題目中描述的革命性(重大飛躍)的特征對于后半問就需要大家根據已有的結論自己尋找了,有了前面的基礎(第一問的影響力不要忘了),這個很簡單,對于這道題的結果可以以表格的形式呈現,可以看看突出顯示表,
6.語文建模
7.語文建模
- 使用 Influence_Data 資料集或其中的一部分創建音樂影響力的(多個)定向網路,其中影 響者連接到追隨者,開發引數來捕捉這個網路中的‘music influence’,通過創建定向影響 者網路的子網路來探索音樂影響力的子集,描述此子網,在這個子網路中,你的‘music influence’指標揭示了什么?
- 使用 FULL_MUSIC_DATA 和/或音樂特征的兩個匯總資料集(具有藝術家和年份)來開發 音樂相似性度量模型,用你的衡量標準,流派內的藝術家比流派間的藝術家更相似嗎?
- 比較流派之間和流派內部的相似之處和影響,流派的區別是什么?流派是如何隨著時間的推移而變化的?流派與流派之間是否關聯
- 說明 DATA_ENAFSONCE 資料集中報告的相似性資料是否表明識別出的有影響了彼此的藝術家,“有影響力的人”真的會影響追隨者創作的音樂嗎?換言之,某些音樂特征是否比其他特征更具“感染力”,還是它們在影響某個特定藝術家的音樂方面都扮演著相似的角色?
- 從這些資料中找出音樂演程序序中是否有可能革命性(重大飛躍)的特征?通過網路的方式
集成集體音樂(ICM)協會確定了您的團隊,以開發一種衡量音樂影響力的模型,這個問題要求您檢查藝術家和流派的進化和革命趨勢,為此,ICM為您的團隊提供了一些資料集:
1)“influence_data”1代表藝術家自己報告的音樂影響者和追隨者,以及行業專家的意見,這些資料包含過去90年中5,854位藝術家的影響者和關注者,
2)“full_music_data”2提供了16個變數項,包括音樂特征(如舞蹈性,速度,響度和調子),以及98,340首歌曲中的每一個的artist_name和artist_id,這些資料用于創建兩個摘要資料集,包括:a.藝術家“data_by_artist”的平均值,b.表示跨年“data_by_year”注意:這些檔案中提供的資料是較大資料集的子集,這些檔案包含您應為該問題使用的唯一資料,
為了執行這個具有挑戰性的專案,ICM協會要求您的團隊通過以下措施,通過音樂藝術家隨時間的影響來探索音樂的發展: - 使用Impact_data資料集或其中的一部分來創建音樂影響力的(多個)定向網路,將影響者連接到追隨者,開發可捕獲此網路中“音樂影響力”的引數,通過創建定向影響者網路的子網來探索音樂影響力的子集,描述此子網,您的“音樂影響力”措施在此子網路中體現了什么?
- 使用音樂特征的full_music_data和/或兩個摘要資料集(包括藝術家和年份)來制定音樂相似度的度量,使用您的度量,流派的藝術家是否比流派的藝術家更相似?
- 比較流派之間和流派之間的相似性和影響,什么是流派的區別,流派如何隨時間變化?有些型別與其他型別有關嗎?
- 指示data_influence資料集中報告的相似性資料是否表明所標識的影響者實際上在影響相應的藝術家,“影響者”實際上會影響追隨者創作的音樂嗎?是某些音樂特征比其他音樂特征更具“感染力”,或者它們在影響特定藝術家的音樂方面起著相似的作用?
- 從這些資料中確定是否存在可能標志著音樂發展中的革命(重大飛躍)的特征?在您的網路中,哪些藝術家代表著革命者(重大變革的影響者)?
- 分析一種型別音樂隨時間變化的影響程序,您的團隊能否確定能揭示動態影響者的指標,并解釋流派或藝術家隨時間的變化?
- 您的作品如何表達有關音樂在時間或環境方面的文化影響的資訊?或者,如何在網路中識別社會,政治或技術變化(例如互聯網)的影響?
完整代碼或者代寫添加QQ1575304183
往期回顧>>>>>>
【資料分析】時變引數隨機波動率向量自回歸模型(TVP-VAR)matlab原始碼
【信號處理】基于ICA演算法信號分離matlab原始碼
【資料分析】模糊二元決策樹matlab原始碼
【資料聚類】基于遺傳演算法之聚類設計matlab原始碼
【資料聚類】基于蟻群演算法聚類matlab原始碼
【資料聚類】基于模擬退火演算法聚類設計matlab原始碼
【資料聚類】基于粒子群演算法之聚類設計matlab原始碼
【資料分析】基于貝葉斯網路識別的機場航班延誤因素分析matlab原始碼
【花式】matlab花風玫瑰圖
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/257774.html
標籤:其他
