（一）作業要求

advertising.csv檔案（檔案私聊可取）是某商品的廣告推廣費用（單位為元）和銷售額資料（單位為千元），其中每行代表每一周的廣告推廣費用（包含微信、微博和其他型別三種廣告費用）和銷售額，若在未來的某兩周，將各種廣告投放金額按如下分配，請預測對應的商品銷售額：

（1）微信：100，微博：100，其他型別：100

（2）微信：200，微博：100，其他型別：50

另外，請提交對應的代碼，若有對應的說明檔案，也請提交，

（二）作業內容

對于這個實驗，是機器學習中最常見的一類回歸問題，通過已有的資料，判斷對某一資料的影響，我將依次按照下列順序進行，

對表格中基本資訊的觀察：

當我們打開Excel檔案的時候，得到的是一系列的資料，一共201行，4列；第一行是標簽的資訊，包括微信、微博、其它和銷售額（前三個是投放），底下的二百行是不同的投放量和對應的銷售額，如此看來不是很直觀，我們可以通過matplotlib將資料可視化出來，另外，為了使繪制的圖更好看，我還使用了seaborn庫中的set函式，

因為我想使用線性回歸的方法對樣本進行估計，所以需要觀測三種投放量之間和銷售額是否存在線性關系，簡單直觀的方式可以是使用散點圖在二維平面中對資料進行可視化表示，于是我們再通過plt.scatter()繪制散點圖：

觀察影像我們得出的結論是：①每種投放量都是在一定區域內浮動的，沒有一個準確的定值，且相對而言微信投放量最大、其他投放次之、微博投放最少②銷售額大體上隨著三種投放的增加而增加，并且在5~25（千元）內浮動③觀察散點圖中銷售額和各投放量的關系我們可以得到：微信投放和銷售額的線性關系最強，其他投放和銷售額的線性關系最弱，但是都滿足，隨著投放量的增長，銷售額也隨之增長，

2、分別對各投放量的銷售額進行估計

上面的散點圖告訴我們，投放量和銷售額大致滿足線性關系，那我們分別用微信投放量、微博投放量、其他投放量和三者總投放量對銷售額進行預測，

用三種總投放量預測銷售額

首先，我們通過pandas庫讀取csv檔案并分別獲取投放量和銷售額的資訊，然后我們通過sklearn.model_selection中的train_test_split將資料分割為測驗集和訓練集，在此我定義測驗集的比例為0.1，因為我首先選擇使用最簡單的線性回歸進行預測，所以我們還要匯入LinearRegression并且通過fit函式對模型進行訓練，訓練之后，為了檢測結果的耦合程度，我們利用測驗集的X_test通過predict函式產生一個預測的y_predict，然后和真實值y_test進行比較，為了使結果更形象，我們可以繪制一個折線圖，并且通過sklearn庫中封裝好的score函式對模型進行評分，然后呈現出來，