主頁 >  其他 > 02_利用numpy解決線性回歸問題

02_利用numpy解決線性回歸問題

2021-04-15 07:36:02 其他

02_利用numpy解決線性回歸問題

目錄
  • 一、引言
  • 二、線性回歸簡單介紹
    • 2.1 線性回歸三要素
    • 2.2 損失函式
    • 2.3 梯度下降
  • 三、解決線性回歸問題的五個步驟
  • 四、利用Numpy實戰解決線性回歸問題
  • 五、總結

一、引言

上一節我們說到了torch和tf的功能,以及兩者的區別,但是為了更好地去讓大家體會框架的強大,我們首先不使用框架實作一個小demo,由于只是引入,因此,我們在這里使用一個比較簡單的線性回歸演算法來講解,

穿插一個廣告,如果你對統計機器學習不是特別熟悉的話,建議你也簡單看看,不說學會那些數學公式的推導,但是得知道那些演算法是干啥的,我這里也有全套的視頻和資料,鏈接在此:https://www.cnblogs.com/nickchen121/p/11686958.html

你都來學習框架了,接下來的所有內容我都默認你有一定的Python基礎、數學基礎、統計機器學習基礎、深度學習基礎,如果你有哪些不太會,我的博客里都有,可以自己去補一補,如果不喜歡我的,可以去bilibili找幾個視頻看,你都不喜歡?那就自己造一個出來,

二、線性回歸簡單介紹

2.1 線性回歸三要素

由于現在統計機器學習一般也稱為機器學習,但是真正的機器學習是包括是深度學習的,所以,接下來講的機器學習這四個字你別太追究它原有的意義,大概知道是啥就行,

在機器學習中,我們知道,每一個演算法簡單點講其實無非就是三個要素:一個輸入、一個模型、一個輸出,而線性回歸屬于機器學習演算法,也是如此,輸入就是一大堆的資料,輸出就是我們想要的結果,而模型就是通過輸入資料得出一個輸出結果,舉個例子吧,

現在我們這里有兩組資料:

\[1.567 = w*x_1+b \\ 3.043 = w*x_2+b \]

這兩組資料中,輸入是\(x_1\)\(x_2\),模型就是一個函式\(f=y=w*x_i+b\),輸出就是\(1.567\)\(3.043\),知道這三個東西有什么用呢?有很大的用,我們可以看到我們這個函式有兩個未知變數\(w\)\(b\),如果我們把這個輸入看作是房子的面積,輸出看成房子的價格,如果我們通過某種方法求出了\(w\)\(b\),我們就可以立即通過另外一個房子的面積\(x_3\)得知這個房子的價格,當然咯,實際情況不會這么簡單,你別較真了,

那么問題來了,我們如何去求出\(w\)\(b\)呢?有些耍些小聰明的同學馬上會說到,這么簡單地問題,我口算一下不就出來了嘛!\(w\approx{1.5}, b\approx{0.06}\),然而這其實離精確求解差遠了,如果這不是求解房價,而是求解股價的問題,那可就差之毫厘謬以千里了,

在這里重點宣告一遍,我們舉這么簡單的例子只是為了讓你明白使用框架和不使用框架的好處,所以一些細節莫鉆牛角尖,學東西要明白重點,

2.2 損失函式

上面說到了,我們給出了一個函式模型\(f_{(w,b)}\),其中\(w\)\(b\)是函式\(f\)的位置變數,我們現在的目的就是通過已有的輸入和輸出求解出這兩個變數,

為了得出這兩個變數,我們這里引入一個專業術語損失(loss)函式,其實我很想寫loss函式,因為有人也把它稱作代價函式,但是相信有一定基礎的人你一定明白,畢竟只是個名字而已,難道我叫吳彥祖我就是吳彥祖了?所以接下來所有的有多個名字的專業術語我都用我了解到的那個名字,

那么損失函式是什么意思呢?其實,顧名思義,就是一個損失,也就是一個差值,什么差值呢?就是我們假設未知變數\(w\)\(b\)已知,簡單點吧,我們假設\(w=b=0\),然后我們根據這個未知變數就可以精準化我們的模型\(f\),然后再通過這個模型以及輸入和輸出便可以得到一個預測值\(\hat{y}=w*x+b\),由于我們的\(w\)\(b\)是假設的,因此預測值\(\hat{y}\)和真實值\(y\)之間有一定的差值,這個差值就是損失,而對\(N\)個資料而言,總損失就是

\[loss = \sum_{i=1}^N{(\hat{y_i}-y_i)} \]

而損失函式指的是對損失的一種擴展,比如線性回歸中最常使用的損失函式就是均方誤差函式,如下:

\[loss = \frac{1}{N}\sum_{i=1}^N{(\hat{y_i}-y_i)}^2 \]

2.3 梯度下降

上面我們得到了一個均方誤差的損失函式,然而可想而知,這個誤差應該是越小越好,因此我們的目標就是最小化這個誤差,上述這個損失函式,其實是一種凸函式,在凸優化理論中,可以使用梯度下降的方法來最小化這個凸函式,而當這個凸函式處于最小值時,此時的\(w\)\(b\)也就是最優值,也就讓\(\hat{y}\)\(y\)的值更接近,

上述所示的函式就是一種凸函式,而該函式的最小值也顯而易見,但是我們不能通過眼睛判斷該函式的最小值,而可以通過梯度下降演算法,這個演算法的流程也很簡單,就是按照某一點在x軸上的梯度的反方向一直前進即可,針對我們上述的\(w\)\(b\)變數,則是:

\[w' = w - lr*\frac{\partial{loss}}{\partial{w}} \\ b' = b - lr*\frac{\partial{loss}}{\partial{b}} \]

從上式我們可以看到有一個\(lr\),其實很好理解,梯度的求解可能是一個很大的值,如上圖,如果在\(x=3\)時梯度值為30,那么\(x\)按照梯度的反方向前進就變成了\(33\),很明顯直接遠離了最小值,因此可以通過控制\(lr\)的大小控制當\(x\)在某一點的移動范圍,\(lr\)大一點則前進的快,\(lr\)小一點則前進的慢,

三、解決線性回歸問題的五個步驟

從上面一節我們可以看出線性回歸的流程簡單點可以分為5個步驟:

  1. 初始化未知變數\(w=b=0\)
  2. 得到損失函式\(loss = \frac{1}{N}\sum_{i=1}^N{(\hat{y_i}-y_i)}^2\)
  3. 利用梯度下降演算法更新得到\(w', b'\)
  4. 重復步驟3,利用\(w', b'\)得到新的更優的\(w', b'\),直至\(w', b'\)收斂
  5. 最后得到函式模型\(f=w'*x+b'\)

四、利用Numpy實戰解決線性回歸問題

步驟1代碼:略

步驟2代碼:計算訓練資料的均方誤差

def compute_error_for_line_given_points(b, w, points):
    """
    y = wx + b, 計算訓練資料的均方誤差
    :param b: 引數b,初始為0
    :param w: 引數w,初始為0
    :param points: 訓練資料,100個二元組,如[(1,2),...,(100,200)]
    :return: 均方誤差
    """

    total_error = 0  # 定義誤差初始值

    # 計算訓練資料的總誤差
    for i in range(0, len(points)):
        x = points[i, 0]
        y = points[i, 1]
        # 計算總誤差
        total_error += ((y - w * x + b)) ** 2

    return total_error / float(len(points))  # 回傳均方誤差

步驟3代碼:計算梯度并更新w和b

def step_gradient(b_current, w_current, points, learning_rate):
    """
    計算梯度并更新w和b
    :param b_current: 更新前的b
    :param w_current: 更新前的w
    :param points: 訓練資料,100個二元組,如[(1,2),...,(100,200)]
    :param learning_rate: 學習速率
    :return: 更新后的w和b
    """

    b_gradient = 0
    w_gradient = 0
    N = float(len(points))

    # 更新梯度
    for i in range(0, len(points)):
        x = points[i, 0]
        y = points[i, 1]
        # grad_b = 2(w * x + b - y),b的求偏導結果
        b_gradient += (2 / N) * ((w_current * x + b_current) - y)  # update b
        # grad_w = 2(w * x + b - y) * x,w的求偏導結果
        w_gradient += (2 / N) * x * ((w_current * x + b_current) - y)  # update w

    # 更新后的w和b
    new_b = b_current - (learning_rate * b_gradient)
    new_w = w_current - (learning_rate * w_gradient)

    return [new_b, new_w]  # 回傳更新后的w和b

步驟4代碼:回圈訓練并更新w和b(此處我們回圈訓練1000次,而不是讓引數收斂)

def gradient_descent_runner(points, starting_b, starting_w, learning_rate, num_iterations):
    """
    回圈訓練并更新w和b
    :param points: 資料
    :param starting_b: b的初始值
    :param starting_w: w的初始值
    :param learning_rate: 學習速率
    :param num_iterations: 訓練次數
    :return: 回傳訓練好的w和b
    """

    b = starting_b
    w = starting_w

    # 回圈更新w和b
    for i in range(num_iterations):
        b, w = step_gradient(b, w, points, learning_rate)

    return [b, w]  # 回傳訓練好的b和w

    # 回圈更新w和b
    for i in range(num_iterations):
        b,w = step_gradient(b,w,points,learning_rate)

    return [b,w] # 回傳訓練好的b和w

步驟5代碼:最后得到函式模型\(f=w'*x+b'\)

五、總結

本篇文章講解了機器學習中較為簡單的線性回歸演算法,雖然很多細節沒有涉及到,例如噪聲的處理和正則化問題、方差和偏差問題、多元特征回歸……

但是本篇文章的核心目的還是想讓大家能夠利用numpy實作線性回歸模型,從最后的代碼中可以看出,利用numpy我們就是在把前面的各種數學語言一個一個實作,求誤差、求偏導、求梯度,這還只是最簡單的回歸問題,如果更復雜呢?我們也這樣,怕是能讓你禿頭,

也因此,我們不得不引出我們接下來要講的框架,他有什么好處,他的好處就是把我們上面的是三個函式封裝好了,你需要做的僅僅只是調個函式,傳個引數即可,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/276106.html

標籤:其他

上一篇:leetcode 105 從前序與中序遍歷序列構造二叉樹

下一篇:AcWing演算法提高課【第一章動態規劃】最長上升子序列模型

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more