資訊爆發時代,有效率有質量地整理視頻、音頻、文字等資訊變得尤為重要,會議、講座、采訪、客服電話等場景均需要形成完整的文字記錄材料,音視頻檔案也要配有字幕,語音轉文字的智能化,讓資訊錄入即時高效,
在直播類、會議類、筆記類的應用中都具備實時語音轉寫功能,例如,在音視頻會議中,可以將發言內容可視化,即時生成會議紀要,方便記錄、修改,提高會議效率;在直播類應用中,可以識別主播所說的話,達到“邊說邊出文字”的效果,提升用戶觀看體驗,營造更好的直播氛圍;在筆記類應用中,支持重點內容隨講隨記,捕捉你的每一個想法,
HMS Core機器學習服務提供實時語音轉寫能力,讓開發者在應用中構建長語音轉文字功能,可以將會議記錄、筆記、總結、音視頻直播內容等音頻流實時轉換為文字流資料結果,實作即時對語音內容的識別,展現對應文字內容,
最高可支持5小時的實時長語音輸入轉換為文本,不僅能夠輸出標點符號,同時可以生成帶有時間戳的文本資訊,不管你是中文普通話、英語、法語,甚至中英文混說都能夠很好識別,滿足不同的場景需要,
實時語音轉寫部署情況

效果展示

在效果展示里我們可以看到通過實時語音轉寫功能轉成的文字在結束后可以即刻進行編輯、復制、修改等,十分方便,
注意事項
? 目前法語實時語音轉寫服務僅支持華為手機和榮耀手機使用,中英文實時語音轉寫服務支持所有品牌手機,
? 實時語音轉寫服務通過訪問云側介面完成識別服務,調測和使用時需保證設備可正常訪問互聯網,
開發步驟
1 .在AppGallery Connect中配置相關資訊,
在開發應用前,需要在AppGallery Connect中配置相關資訊,
具體開發準備可以參考檔案
2 .配置HMS Core SDK的Maven倉地址,
2.1 打開Android Studio專案級“build.gradle”檔案,

2.2 添加HUAWEI agcp插件以及Maven代碼庫,
在allprojects->repositories里面配置HMS Core SDK的Maven倉地址,
allprojects {
repositories {
google()
jcenter()
maven {url 'https://developer.huawei.com/repo/'}
}
}
在buildscript->repositories里面配置HMS Core SDK的Maven倉地址,
buildscript {
repositories {
google()
jcenter()
maven {url 'https://developer.huawei.com/repo/'}
}
}
在buildscript ->dependencies里面增加配置,
buildscript{
dependencies {
classpath 'com.huawei.agconnect:agcp:1.3.1.300'
}
}
3 .創建語音識別器,并設定配置,
MLSpeechRealTimeTranscriptionConfig config = new MLSpeechRealTimeTranscriptionConfig.Factory()
// 設定語言,目前支持中文、英語、法語轉寫,
.setLanguage(MLSpeechRealTimeTranscriptionConstants.LAN_ZH_CN)
// 設定標點,
.enablePunctuation(true)
// 設定句子的偏移,
.enableSentenceTimeOffset(true)
// 設定詞的偏移,
.enableWordTimeOffset(true)
.create();
MLSpeechRealTimeTranscription mSpeechRecognizer = MLSpeechRealTimeTranscription.getInstance();
4. 創建語音識別結果監聽器回呼,
// 回呼實作MLSpeechRealTimeTranscriptionListener介面,實作介面中的方法,
Protected class SpeechRecognitionListener implements MLSpeechRealTimeTranscriptionListener{
@Override
public void onStartListening() {
// 錄音器開始接收聲音,
}
@Override
public void onStartingOfSpeech() {
// 用戶開始講話,即語音識別器檢測到用戶開始講話,
}
@Override
public void onVoiceDataReceived(byte[] data, float energy, Bundle bundle) {
// 回傳給用戶原始的PCM音頻流和音頻能量,該介面并非運行在主執行緒中,回傳結果需要在子執行緒中處理,
}
@Override
public void onRecognizingResults(Bundle partialResults) {
// 從MLSpeechRealTimeTranscription接收到持續語音識別的文本,
}
@Override
public void one rror(int error, String errorMessage) {
// 識別發生錯誤后呼叫該介面,
}
@Override
public void onState(int state,Bundle params) {
// 通知應用狀態發生改變,
}
}
5. 系結語音識別器,
mSpeechRecognizer.setRealTimeTranscriptionListener(new SpeechRecognitionListener());
6 .呼叫startRecognizing啟動語音識別,
mSpeechRecognizer.startRecognizing(config);
7. 識別完成后,結束識別并釋放資源,
if (mSpeechRecognizer!= null) {
mSpeechRecognizer.destroy();
}
了解更多詳情>>
訪問機器學習服務聯盟官網
獲取機器學習服務開發指導檔案
訪問華為開發者聯盟官網
獲取開發指導檔案
華為移動服務開源倉庫地址:GitHub、Gitee
關注我們,第一時間了解 HMS Core 最新技術資訊~
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/472405.html
標籤:Android
