吳恩達機器學習2——單變數線性回歸-有解無憂

吳恩達機器學習2——單變數線性回歸

監督學習作業模式
在這里插入圖片描述
訓練集中同時給出了輸入輸出，即人為標注的“正確結果”喂給學習演算法，得到一個函式h，h
可以根據輸入的x得到一個y，因此h是x到y的一個映射，
一種可能的表達方式為：
hθ(x)=θ0+θ1x
因為只含有一個特征/輸入變數，因此這樣的問題叫作單變數線性回歸問題，
x：特征/輸入變數
上式中， θ為引數， θ 的變化才決定了輸出結果，不同以往，這里的 x 被我們視作已知(不論是資料集還是預測時的輸入)，所以怎樣解得 θ以更好地擬合資料，成了求解該問題的最終問題，

2.2代價函式（cost function）

損失函式（loss function）：計算單個樣本的誤差
代價函式（cost function）：計算整個訓練集所有損失函式之和的平均值

我們的目的在于求解預測結果h最接近實際結果y時θ的取值，
為求解最小值，引入代價函式（cost function）的概念
在這里插入圖片描述
問題轉化為求解J（θ0，θ1）的最小值
系數1/2不影響結果，是為了在應用梯度下降時，平方的導數抵消1/2，便于計算，

假設θ0=0，得到的hθ（x）和J（θ1）如下
在這里插入圖片描述

以此類推，θ≠0時
在這里插入圖片描述

可以看出仍存在一點使J（θ0，θ1）最小.

2.5梯度下降（gradient descent）

梯度下降背后的思想是：開始時，我們隨機選擇一個引陣列合（θ0，θ1，…θn）即起始點，計算代價函式，然后尋找下一個能使得代價函式下降最多的引陣列合，不斷迭代，直到找到一個區域最小值(local minimum)，由于下降的情況只考慮當前引陣列合周圍的情況，所以無法確定當前的區域最小值是否就是全域最小值(global minimum)，不同的初始引陣列合，可能會產生不同的區域最小值，
在這里插入圖片描述
批量梯度下降（batch gradient descent）演算法的公式為：