?? 作者:韓信子@ShowMeAI
?? 機器學習實戰系列:https://www.showmeai.tech/tutorials/41
?? 本文地址:https://www.showmeai.tech/article-detail/333
?? 宣告:著作權所有,轉載請聯系平臺與作者并注明出處
?? 收藏ShowMeAI查看更多精彩內容
本篇內容 ShowMeAI 將帶大家學習,從頭開始構建機器學習管道,使用 Flask 框架構建 Web 應用程式,并部署到云服務器上的程序,具體包括:
- 何為機器學習應用部署
- 基于 PyCaret 開發機器學習全流程
- 基于 Flask 搭建簡易前端 Web 應用程式
- 在 Heroku 云上部署機器學習應用
本示例中的應用為保險金額預估,部署好的云端服務頁面如下圖所示,可以點擊 ??這里體驗,
?? 環境&工具
?? PyCaret
??PyCaret 是一個開源的低代碼機器學習庫,用于在生產中訓練和部署機器學習管道/流水線和模型,我們可以通過pip安裝 PyCaret,
# 安裝pycaret
pip install pycaret
?? Flask
??Flask 是一個用于在 Python 中構建 Web 應用程式的輕量化框架,我們本次的應用需要部署成Web端可互動操作使用的形態,會用到這個工具庫,我們同樣可以通過pip安裝它,
# 安裝flask
pip install flask
?? Heroku
?? Heroku 是一個平臺即服務(PaaS),它支持基于托管容器系統部署 Web 應用程式,具有集成的資料服務和強大的生態系統,我們將基于它將應用程式部署到云端,進而大家可以直接通過 URL 在瀏覽器端訪問應用,
?? 部署機器學習服務
在企業的實際生產中,我們經常會把機器學習模型構建成服務形態,這樣協作的開發同事可以通過介面(API)來訪問模型服務,完成預估任務,這被稱為部署機器學習應用程序,
更全一點說,生產中使用機器學習管道有兩種廣泛的方式:
- 批量預測
將模型或管道存盤在磁盤中,定期運行腳本,加載模型和資料,生成預測并將輸出寫入磁盤,這種情況下,多個預測會并行,它對于時效性要求不高,
- 在線預測
需要實時預測,大家使用到的很多 app,其實都是輸入資訊,然后在單擊提交按鈕時,實時預估生成預測的,比如你在電商平臺輸入搜索詞,點擊查詢,可以看到模型排序好的結果串列回傳,
本教程中,我們講解的是『在線預測』這種模式,我們將首先使用 PyCaret 在 Python 中構建機器學習管道,然后使用 Flask 構建 Web 應用程式,最后將所有這些部署在 Heroku 云上,
整個機器學習管道(pipeline)如下圖所示:
?? 場景案例&手把手
本案例中用作示例的資料來自保險場景,保險公司希望通過使用人口統計學資訊和基本患者健康風險特征,更準確地預測患者保單費用,以優化其使用的現金流預測的準確性,資料是 PyCaret 自帶的,資料的簡單速覽如下:
下面我們逐步完成機器學習管道構建與云端部署的程序,
?? 第一步:構建機器學習流水線
我們把整個建模程序構建為一個流水線,這里我們使用 PyCaret,幾乎可以自動化地完成這個程序,
# 加載資料
from pycaret.datasets import get_data
data = https://www.cnblogs.com/showmeai/archive/2022/11/19/get_data('insurance')
# 初始化設定
from pycaret.regression import *
s = setup(data, target = 'charges', session_id = 123, normalize = True, polynomial_features = True, trigonometry_features = True, feature_interaction=True, bin_numeric_features= ['age', 'bmi'])
上述的代碼會自動化完成資料轉換,轉換后的資料集有 62 個用于訓練的特征,這些特征由原始資料集的 7 個特征變換而來,以下為對應的特征串列:
使用PyCaret進行建模和評估非常簡單,下面示例代碼中,我們選擇邏輯回歸模型,并進行10折交叉驗證:
# 模型訓練
lr = create_model('lr')
# 繪制訓練模型的殘差
plot_model(lr, plot='residuals')
上述流程之后,我們可以使用該save_model函式保存整個建模流水線,
# 保存轉換流水線和模型
save_model(lr, model_name='/username/ins/deployment')
這樣我們就快速完成了第 1 步,注意,實際業務場景下,大家會做更精細化的資料清洗、特征工程和模型調優,我們本次的目標是給大家演示從建模到部署的全流程方法,因此這個部分相對簡略,
PyCaret 自動化建模的輸出是一個流水線/pipeline,包含幾個資料轉換步驟(如特征工程、縮放、缺失值插補等)和機器學習模型,流水線保存為pkl格式的檔案,我們在后續構建 Flask 應用程式會使用到它,
?? 第二步:使用 Flask 構建前端應用程式
在完成我們的機器學習流水線和模型之后,我們要開始開發 Web 應用程式,它由兩個部分組成:
- 前端(基于 HTML 構建網頁端可顯示和互動的內容)
- 后端(基于 Flask 開發完成接收請求后可以進行預估的程式)
① Web 應用前端
很多 Web 應用程式的前端都是使用 HTML 構建的,我們在本篇內容中不會深入講解前端相關的內容,為了構建一個輸入表單(以接收用戶實時預估時輸入的欄位取值),我們基于一個基本的 HTML 模板完成前端網頁,然后包含一個 CSS 樣式表,
? HTML 代碼實作
以下是我們 Web 應用程式主頁的 HTML 代碼,
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>Predict Insurance Bill</title>
<link href='https://fonts.googleapis.com/css?family=Pacifico' rel='stylesheet' type='text/css'>
<link href='https://fonts.googleapis.com/css?family=Arimo' rel='stylesheet' type='text/css'>
<link href='https://fonts.googleapis.com/css?family=Hind:300' rel='stylesheet' type='text/css'>
<link href='https://fonts.googleapis.com/css?family=Open+Sans+Condensed:300' rel='stylesheet' type='text/css'>
<link type="text/css" rel="stylesheet" href="https://www.cnblogs.com/showmeai/archive/2022/11/19/{{ url_for('static', filename='./style.css') }}">
</head>
<body>
<div >
<h1>Predict Insurance Bill</h1>
<!-- Form to enter new data for predictions -->
<form action="{{ url_for('predict')}}"method="POST">
<input type="text" name="age" placeholder="Age" required="required" /><br>
<input type="text" name="sex" placeholder="Sex" required="required" /><br>
<input type="text" name="bmi" placeholder="BMI" required="required" /><br>
<input type="text" name="children" placeholder="Children" required="required" /><br>
<input type="text" name="smoker" placeholder="Smoker" required="required" /><br>
<input type="text" name="region" placeholder="Region" required="required" /><br>
<button type="submit" >Predict</button>
</form>
<br>
<br>
</div>
{{pred}}
</body>
</html>
大家如果要構建簡單的應用程式,不需要專門去學一遍 HTML 的高級知識,大家在互聯網上可以找到大量 HTML 和 CSS 模板,甚至有些 ??在線平臺 可以通過使用拖拽構建用戶界面,并快速生成對應的 HTML 代碼,
? CSS 樣式表 CSS 負責描述 HTML 元素在螢屏上的呈現樣式,借助 CSS 可以非常有效地控制應用程式的布局,存盤在樣式表中的資訊包括邊距、字體大小和顏色以及背景顏色,這些資訊以 CSS 擴展名的檔案格式存盤在外部位置,主 HTML 檔案包含對 CSS 檔案的參考,
② Web 應用后端
下面我們完成這個應用的后端,我們在 Python 中可以使用 Flask 工具庫完成,關于 Flask 的詳細知識大家可以參考 ??官方網站,我們的部分代碼如下:
在云端部署之前,我們需要在本地測驗應用是否正常作業,我們在命令列運行 python app.py:
python app.py
上圖中大家可以在最后一行看到本地的測驗 URL,我們把它粘貼到瀏覽器可以查看 Web 應用程式是否正常,我們還可以通過輸入一些測驗資料來檢查預測功能是否正常運行,如下例中,我們輸入資訊:19 歲、吸煙、西南地區、沒有孩子、女性,模型預測住院費用為 20900 美元,
好啦,測驗完畢,完全可以正常作業,我們在下一步把它部署到云端,
?? 第三步:在 Heroku 上部署 ML 流水線和應用程式
模型訓練完成后,機器學習流水線已經準備好,且完成了本地測驗,我們現在準備開始部署到 Heroku,有多種方法可以完成這個步驟,最簡單的是將代碼上傳 GitHub ,并連接 Heroku 帳戶完成部署,
下圖是上傳好的截圖,大家可以在 ??https://www.github.com/pycaret/deployment-heroku 查看,
將所有檔案上傳到 GitHub 后,我們就可以開始在 Heroku 上進行部署了,如下為操作步驟:
① 注冊并點擊 『 創建新應用 』
在 ??heroku 上可以完成上述操作,如下圖所示
② 輸入應用名稱和地區
③ 連接到托管代碼的 GitHub 存盤庫
④ 部署分支
⑤ 等待部署完成
部署完成后,在有網路的情況下,就都可以訪問對應的應用程式了 ??https ??/pycaret-insurance.herokuapp.com/,
參考資料
- ?? PyCaret:https://www.pycaret.org/
- ?? Flask:https://flask.palletsprojects.com/en/2.2.x/
- ?? Heroku:https://www.heroku.com/
- ?? HTML 和 CSS 模板在線平臺:http://www.vvveb.com/vvvebjs/editor.html
- ?? Flask 的詳細知識:https://dormousehole.readthedocs.io/en/latest/
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/536236.html
標籤:其他
上一篇:「動態規劃」欠債還錢
