文章目錄
- 一、前期作業
- 二、呼叫百度語音SDK,基于python3
一、前期作業
1.擁有一個百度智能云賬號
2.創建一個語音應用,創建成功后會顯示有一個應用
3.在應用串列里查看自己的應用
強調:
這里的AppID、API Key、Secret Key 很重要
百度除了語音識別等其余的api呼叫也離不開這三個重要的引數,
二、呼叫百度語音SDK,基于python3
操作流程:
1.下包
我使用的是pip install baidu-aip

2.新建AipSpeech
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
3.配置AipSpeech(一般不需要)
4.請求說明
以識別本地語音檔案為例,假設本地有個語音檔案是audio.pcm:
# 讀取檔案
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 識別本地檔案
client.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
'dev_pid': 1537,
})
注意:
1.本地語音檔案的后綴名要和后面的引數一一對應
2.音頻的采樣率固定為16000/8000,不符合此采樣率的音頻識別不出來
3.語音檔案的格式支持pcm / wav / amr
// 成功回傳
{
"err_no": 0,
"err_msg": "success.",
"corpus_no": "15984125203285346378",
"sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
"result": ["北京天氣"]
}
// 失敗回傳
{
"err_no": 2000,
"err_msg": "data empty.",
"sn": null
}
更多詳情請見
百度語音識別官網技術檔案(https://cloud.baidu.com/doc/SPEECH/s/1k4o0bmc7)
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/216944.html
標籤:其他
