文章目錄
- VB模組簡介
- 1. 二次開發介紹
- 1.1 硬體準備
- 1.1.1 硬體清單
- 1.1.2 硬體接線
- 1.2 軟體準備
- 1.3 詞條與提示音制作
- 1.3.1 詞條修改
- (1) 詞條檔案處理
- (2) 工程代碼修改
- 1.3.2 提示音制作
- 1.4 程式編譯與韌體燒錄
- 1.4.1 工程編譯
- 1.4.2 韌體燒錄
- 聯系我們
VB模組簡介
VB系列模組是我司開發的一款AI離線語音識別的產品,主芯片是華鎮公司推出的語音大腦VB590,具有超低成本,高可靠性,通用性強的特點,在語音識別技術上實作了高可靠的喚醒識別率、更遠距離的喚醒、更低誤喚醒率、更強的抗噪音能力、更快的回應識別時間,免聯網的純離線識別,
VB系列開發板以我司VB-01/VB-02為主控模組,型號分別是VB-01-Kit和VB-02-Kit,開發板只需外接麥克風、喇叭,連接供電電路,即可進行開發使用,
本文將以VB-01-Kit開發板為例,介紹VB系列開發板的二次開發程序,
1. 二次開發介紹
1.1 硬體準備
1.1.1 硬體清單

| 元器件名稱 | 數量 |
|---|---|
| VB-01-kit開發板 | 1 個 |
| 下載器 | 1 個 |
| 麥克風 | 1 個 |
| 喇叭 | 1 個 |
| 安卓資料線 | 2 條 |
| 杜邦線 | 3 條 |
1.1.2 硬體接線
| VB-01-Kit開發板 | 下載器 |
|---|---|
| GND | GND |
| PA20_SDA | TCK |
| PA19_SCL | TMS |
| MCU_RES | NRST |
完成以上接線之后,VB-01-Kit開發板與下載器均通過安卓資料線連接PC機,
1.2 軟體準備
整個操作程序需要用到的軟體有:
- 二次開發編程軟體:cdk-windows-V2.2.1-20200418-2230
- 韌體燒錄軟體:CSKYFlashProgrammer.exe
- 提示語音轉換工具:WnvcEncoderTool_200922_V1.4.exe
- 文字轉語音軟體:Installer_迅捷文字轉語音_r1.7.5.exe
軟體以及使用說明書下載鏈接:https://pan.baidu.com/s/190j8HMVYrpi8FSjxwJ7bFw 提取碼:t98q
其它產品資料可前往官網獲取:https://docs.ai-thinker.com/voice_module
1.3 詞條與提示音制作
VB系列開發板的開發程序中,核心部分就是詞條的制作與修改,以及提示音的制作與修改,本章節主要介紹這兩個部分的內容,
1.3.1 詞條修改
(1) 詞條檔案處理
- 創建一個文本檔案(.txt),隨機命名,并在該檔案中編輯所要用到的詞條內容;
- 通過瀏覽器訪問:華鎮電子AI語音識別在線訓練平臺;
- 在該平臺上注冊賬號,并登錄;
- 點擊選擇檔案,指定路徑至創建好的詞條檔案,點擊確認上傳;


- 上傳成功以后,點擊開始計算,計算完畢,下載解碼圖;

-
下載好解碼圖(一個.h 檔案:fst_info.h),將該檔案復制到路徑:VB01_Demo_CDK\projects\examples\asr_fst\app\src 下;

-
進入 asr_fst/CDK 目錄下,雙擊libasrfst.cdkws檔案,打開工程;

-
選中工程名字,點擊右鍵,點擊 “ Build ALL ”,編譯工程;

-
編譯成功以后將在路徑:asr_fst\CDK\libasrfst\Obj 下生成一個(libasrfst.a)靜態檔案;
-
將生成的靜態檔案復制粘貼到路徑:VB01_Demo_CDK\projects\examples\Asr_Demo\lib 下;

(2) 工程代碼修改
工程代碼的修改部分,需要修改的檔案有以下三個檔案:
- asr_config.c :詞條定義檔案
- asr_config.h :詞條配置各個引數的組態檔
- app_codec.h :主要修改音量配置
修改asr_config.c檔案的喚醒詞條以及總詞條內容,如下,將原喚醒詞更改為新定義的三個喚醒詞:

修改asr_config.h檔案中喚醒詞個數變數改為3:

修改app_codec.h檔案的設定音量的變數,這里將該值改為0x3A:

1.3.2 提示音制作
-
通過迅捷語音助手將需要用到的提示音文字轉換為語音檔案;

-
將所有的語音檔案按照既定順序重命名為:00.wav、01.wav、02.wav等等,以下為本次操作提示音的順序:

-
完成提示音制作之后,將所有提示音存放到路徑:VB590_Tools\WnvcEncoderTool_200922_V1.4\input

-
通過軟體 WnvcEncoderTool_200922_V1.4 將語音檔案轉換為語音庫,具體操作如下:
- 進入 WnvcEncoderTool_200922_V1.4 目錄,之后運行 GetFileName.exe ,運行結束再運行軟體 WnvcEncoderTool_200922_V1.4.exe ,之后在終端視窗輸入語音檔案的存放路徑,這里是 input 檔案夾,因此輸入命令: ./input/ ,之后再輸入 回車 ,
- 上一條命令運行結束再輸入命令: ./output/ ,輸入 回車 ,再輸入 16000 ,輸入 回車 ,運行結束,輸入任意鍵退出終端視窗,

- 完成以上操作以后,將在output檔案夾下生成提示語音的庫檔案(app_beep.c、app_beep.h):

- 將這兩個檔案分別復制粘貼到工程的src以及include檔案夾下面;


1.4 程式編譯與韌體燒錄
1.4.1 工程編譯
- 完成上述操作以后,回到工程的路徑: VB01_Demo_CDK\projects\examples\Asr_Demo ,雙擊 project.cdkproj 檔案,打開工程;

- 選中專案,右鍵點擊 Build ALL ,編譯工程;

- 編譯成功,將生成可燒錄韌體 (Asr_Demo.elf) ,韌體路徑為: VB01_Demo_CDK\projects\examples\Asr_Demo\Obj

1.4.2 韌體燒錄
-
安裝驅動
完成VB-01-Kit開發板與下載器之間的接線之后,進入計算機管理,找到下載器埠,右鍵更新驅動,指定驅動到路徑: FlashProgrammer\Tools\cklink_dirvers ,完成驅動安裝以后,就可以燒錄韌體了;

-
打開 CSKYFlashProgrammer.exe 軟體,選中剛剛編譯生成的韌體(Asr_Demo.elf),路徑為:VB01_Demo_CDK\projects\examples\Asr_Demo\Obj

-
韌體燒錄成功以后,復位VB-01-Kit開發板便可聽到自制開機提示音,
聯系我們
以上就是本期分享的內容,目的在于讓大家快速適應新品方案的開發,以上提供的驅動原始碼聯系我們可以免費提供
官方官網:https://www.ai-thinker.com
開發資料:https://docs.ai-thinker.com/
官方論壇:http://bbs.ai-thinker.com
商務合作:sales@aithinker.com
技術支持:support@aithinker.com
公司地址: 深圳市寶安區西鄉固戍華豐智慧創新港C棟410
聯系電話:0755-29162996
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/292452.html
標籤:其他
