實作效果:
該AI智能小程式目前集成了百度AI開放平臺數十個AI服務產品功能,包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標識別、手勢識別、商標識別、果蔬識別、菜品識別等圖片識別功能,以及黑白影像上色、圖片風格變換等影像處理的功能,
1 系統框架
小程式將常用功能按Ai技術分為五大類:文字識別、語音技術、影像技術、視頻技術和自然語言處理(NLP),然后根據具體功能再進行細分,本文主要介紹百度AI開放平臺計算機視覺方面服務產品的測驗程序及效果,通過微信小程式實作API呼叫,小程式將用戶上傳的圖片提交給百度AI服務,回傳識別結果,全部功能都在小程式客戶端完成,不需要服務器,適合個人開發者學習除錯使用,同時也為商業應用提供相應解決方案,
開發平臺:微信開發者工具 V1.02
開發語言:java script
測驗環境:Andriod 9.0
2 微信小程式開發程序
2.1注冊微信小程式
注冊地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN
注冊成功后在開發->開發者ID里找到AppID,這是開發微信小程式所需要的身份標識,然后填寫服務器域名,需要用到的均要填上,如下圖,
2.2 小程式的配置已基本完成,下一步需要下載開發工具了,微信自己開發的IDE,下載地址是:
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html
2.3小程式開發檔案:https://developers.weixin.qq.com/miniprogram/dev/framework/
2.4小程式開發界面
如下圖,標紅處需要填入注冊時獲得的APPID,
2.5程式總體結構
Pages下的每個檔案夾對應實作一種AI功能,添加新的AI功能,比如添加駕駛證識別功能,在根目錄的全域組態檔app.json中增加:"pages/ driving_license/ driving_license" ,會自動創建相關頁面檔案夾,其內部結構如下:
driving_license.js:功能邏輯模塊
driving_license.wxss:頁面樣式檔案
driving_license.wxml:頁面布局檔案
driving_license.json:頁面組態檔
3 程式功能實作說明
想了解微信小程式中百度API介面的呼叫程序,請參看我之前的帖子:
營業執照識別:https://ai.baidu.com/forum/topic/show/956171
增值稅發票識別:https://ai.baidu.com/forum/topic/show/956168
車牌識別:https://ai.baidu.com/forum/topic/show/956167
手寫文字識別:https://ai.baidu.com/forum/topic/show/956153
影像風格轉換:https://ai.baidu.com/forum/topic/show/956135
文字識別:https://ai.baidu.com/forum/topic/show/954152
iOCR財會版:https://ai.baidu.com/forum/topic/show/956136
當然,還有更多百度AI服務功能可以陸續添加,按照以上文章鏈接所提供的方法稍作修改即可,有興趣的同學可以試試,
4 測驗效果
以下選取了部分圖片識別的測驗效果:
4.1菜品識別
4.2 車型識別
4.3地標識別
4.4動物識別
4.5紅酒識別
4.6 貨幣識別
4.7 植物識別
4.8 黑白影像上色
4.9 清點人數
4.10 通用物體與場景識別
5 測驗結論
5.1識別能力
根據拍攝照片,識別圖片內容,廣泛應用于娛樂類APP,自助結算等業務場景中,目前影像識別具備的識別能力如下:
品牌logo識別 :識別4萬種商品logo,支持定制logo圖庫
植物識別 :識別2萬多種通用植物和近8千種花卉
動物識別 :識別近8千種動物
菜品識別 :識別超過近九千種菜品,支持定制菜品圖庫
地標識別 :識別5萬中外著名地標、景點
果蔬識別 :識別近千種水果和蔬菜
紅酒識別 :識別數十萬中外紅酒名稱及詳細介紹
貨幣識別 :識別國內外常見貨幣,支持正反面、紀念鈔
車型識別 :識別3千款常見車型,可回傳車型百科資訊
營業執照識別 :識別各版式營業執照所有關鍵欄位
增值稅發票識別 :識別增值稅普票或專票所有30個欄位
駕駛證識別 :識別機動車駕駛證正本所有9個欄位
車牌識別 :識別藍牌、綠牌、單/雙行黃牌等型別車牌
手寫文字識別 :識別圖片中的手寫數字、手寫中文
表格文字識別 :識別表頭、表尾及每個單元格的文字內容
人臉檢測 :回傳人臉框與關鍵點,識別多種人臉屬性
手勢識別 :識別24種常見手勢,支持自拍、他人拍攝
5.2 特色優勢
1)影像識別功能豐富
支持多種垂類業務場景的細粒度影像識別,精準識別超過十萬種物體和場景,基于百度海量資料,持續豐富介面回傳內容資訊,
2)識別準確性高
基于百度豐富的海量資料,利用深度學習技術及精準的演算法迭代模型,不斷提高準確性,
3)作業穩定性好
提供24小時云端高穩定服務,宕機率低,故障恢復快,單圖毫秒級回應,服務可用性高達99.95%,
4)支持定制化識圖
支持根據不同的業務場景定制客戶專屬的AI識圖能力,滿足非通用場景下的業務需求,例如品牌logo,菜品識別均可自定義庫,
5)支持獲取百科資訊
支持識別結果中回傳百度百科的內容,讓客戶業務功能更完善、內容更豐富,
作者:wangwei8638
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/5472.html
標籤:其他
