想自己做出個ttS軟體,網上有人說把全部漢字各錄成wav檔案。然后......
之后怎樣做就模糊了,有人知道具體實作tts 的流程嗎?都要做哪些作業,
網上有人說工程量很大,這不怕,真的。 現在最希望的就是有人幫忙指個路,滿地亂轉真不好玩。幫幫忙,小女子感激不盡!!!!!1
uj5u.com熱心網友回復:
哇,牛人啊。估計要估一個能出聲的TTS不復雜,要能做出能接受的TTS,就不容易了。
uj5u.com熱心網友回復:
uj5u.com熱心網友回復:
科大訊飛 和 捷通 都是做 tts的,你可以參考一下!不過不像樓主想的那么簡單,想做一個TTS產品還是比較復雜的uj5u.com熱心網友回復:
我想知道該如何參考看,關鍵人家的都要付費的。
我想先實作簡單的,再慢慢升華
uj5u.com熱心網友回復:
asdfffffffffuj5u.com熱心網友回復:
剛找到些好似有用的東西:當前位置:首頁>>通信技術>>CTI>>產品資訊>>語音合成
捷通漢語語音合成(TTS)技術介紹及解決方案
資訊來源: CTI論壇 采集時間: 2002-09-01 00:00:00
一、 捷通華聲TTS(jTTS)介紹
1. 捷通華聲TTS技術文語轉換的基本原理
捷通TTS技術文語轉換的基本結構:
基本結構:
語言學處理
語言學處理在文語轉換系統中起著重要的作用,他主要是模擬人對自然語言的理解程序--文本規整、詞的切分、語法分析和語意分析,使計算機對輸入的文本能完全理解,并給出后兩部分所需要的各種發音提示。
韻律處理
韻律處理的目的是為合成語音規劃出音段特征,如音高、音長和音強等,使合成語音能正確表達語意,聽起來更加自然悅耳。
聲學處理
聲學處理的主要功能是根據前兩部分處理結果的要求輸出語音,即合成語音。
2. 捷通華聲TTS的特點
捷通華聲的TTS技術(jTTS),是具有自我著作權的TTS技術,以大規模真實錄音的語音庫為基礎,采用多樣本、不等長言語段波形拼接技術,增加音庫壓縮演算法和音色變換演算法形成核心技術,發音清晰流利、自然度高。
捷通華聲TTS在文本到語音的轉換程序中不是對文字到語音的簡單映射,還包括了對文字的理解,以及對語音的韻律處理。
捷通華聲通過研究漢語的聲調、重音、語調的聲學特點,設計了重音和語調的模擬。
捷通華聲TTS在韻律規則方面,采用統計和規則相結合的方法,研究了漢語韻律規則并進行了一定的韻律模擬作業,以韻律層級的匹配作為選音段的基本原則。
捷通華聲TTS提供中英文混讀功能,嵌入中文內部的常用單詞的音色與中文保持一致,更加自然流暢。
捷通華聲TTS的音庫大小可調節,能提供從PC、語音卡到掌上電腦TTS技術的全面解決方案。可以將音庫和程式壓縮到共1.5M的水平,實作了在嵌入式系統上的應用。
提供捷通華聲TTS開發工具包(jTTS SDK),可以合成到聲卡,合成到檔案,直接獲取語音流,支持多執行緒操作,支持GBK、BIG5字符集的文本閱讀。 其中音庫大小可調節的特點是捷通華聲TTS能夠移植到掌上電腦等嵌入式設備的關鍵特點,也是捷通華聲TTS獨具的優點。
支持多種作業系統,如WindowsNT/2000/XP、Linux及各種嵌入式作業系統。
捷通華聲公司在2001年7月完成了最新版本的捷通華聲TTS核心。新版本基于大規模真實錄音的語音庫,音庫提供的樣本多,選音范圍大,可選擇到更匹配的發音,另外,在選音和拼接時將超越了音節的層次,能夠進行詞甚至短句層次的拼接。因此,在自然度、可懂度方面捷通華聲新TTS具有較大的提高。再加上英文單詞的音色與中文保持一致,可支持GBK字庫中的所有字符的發音,新的捷通華聲TTS技術的合成的語音幾乎達到自然說話的效果。
3. 捷通華聲TTS的進一步發展方向
捷通華聲TTS將在下面幾個方向發展:
進一步提高語音合成的質量,達到更加流利和自然的程度。
進一步研究音色的轉換功能,使得TTS技術可以實作各種音色(包括不同性別、不同年齡、不同發音特征等的語音輸出。
為各行業提供TTS核心技術和解決方案,特別是CTI行業和嵌入式系統領域。
將TTS技術移植到其它作業系統,例如Unix,移植到其它嵌入式作業系統,例如Palm OS, HOPEN等;考慮TTS技術的硬體實作。
將TTS技術和其它各種新技術相結合,并在更為廣泛的范圍內推廣和應用TTS技術。 捷通華聲TTS技術可以普遍應用在計算機和通訊領域的許多方面。捷通華聲公司將努力成為一個TTS核心技術的供應商,并在下列領域廣泛應用TTS技術,進一步為TTS技術的應用做出自己的貢獻。
二、 捷通華聲TTS技術(jTTS)在CTI領域中的應用
捷通華聲TTS技術在CTI行業中的應用提供三種解決方案:本地介面呼叫方案、語音服務器方案、離線合成方案。
1. 捷通華聲TTS本地介面呼叫方案(jTTS SDK)
方案概論:
本地介面呼叫方案提供捷通華聲TTS開發工具包(jTTS-SDK)可使用戶在其開發的系統中加入語音合成的功能。jTTS-SDK是基于Win32(32位Windows環境,包括Windows95/98/2000/NT)平臺下的開發工具包,因此這種方案要求使用方的聲訊服務系統所運行的是32 位Windows環境的服務器,并且需要對使用方系統進行部分程式的改造。該方案適用于要求使用方具有二次開發能力的集成和應用商。
本地介面呼叫方案架構圖
2. 捷通華聲TTS語音服務器方案 (jTTS Service )
方案概論:
語音服務器方案直接提供裝載有捷通華聲TTS語音服務系統的高性能的服務器,它與現有的聲訊服務相平行,接受其指令和文字資料流,合成產生語音資料流返給原系統,適用于電信、大型企業CTI系統及聲訊臺改造、升級。
語音服務器方案架構圖
技術優勢:
1. 降低了客戶端機器的配置需求。
2. 通過TCP/IP協議實作了跨作業系統的語音合成服務功能,可以滿足非Win32平臺的需求。
3. 對于服務規模較大的系統可實作語音服務器的分布式作業方式,對客戶端的請求自動調度,平衡負載,以達到更高的性能。
應用領域:
采用語音服務器方案可在不改變現有服務系統的條件下,平行地建立捷通華聲TTS語音服務器,安全、高效率地將原來的文本服務擴大為文本-語音同時服務,是大型、專業級的語音服務解決方案,并可跨平臺實作。捷通華聲TTS語音服務器方案可服務于160、168等聲訊臺、UMS統一資訊服務系統、呼叫中心、語音郵件商、WAP網站、進行網上播音的.com公司等。
3. 捷通華聲TTS離線合成方案(jTTS Builder)
方案概論:
捷通華聲TTS離線合成方案提供離線合成工具,這是基于Microsoft Windows 95/98/NT/2000的獨立應用程式,可提供離線的語音合成服務,批量地將文字轉換為語音資料檔案,適用于海量資訊、相對穩定或不要求實時轉化的聲訊服務場合,可以直接替代傳統的錄音方法,對原有系統完全無需改造,節省人力,提高效率。
uj5u.com熱心網友回復:
我以前的畢業設定就是做這個。。。但用系統自帶的英文語音庫和網上下載的中文語音庫,是可以讀出來,但因為語音庫不好,所以效果不是很滿意。所以重點在做語音庫。這是一種。
還有一種就是采用韻律合成技術,這個我沒有接觸,不敢多說。呵呵。
uj5u.com熱心網友回復:
我個人做的差不多了,如果有商業合作的話,可以聯系我qq:79627128
uj5u.com熱心網友回復:
我也在做,用MFC +tts 界面是出來了,除錯無誤但是無法發音uj5u.com熱心網友回復:
科大訊飛 實在是太貴了啊,那里有破解的啊?有沒有說明怎么呼叫服務啊?uj5u.com熱心網友回復:
都是強人,我只想呼叫他人的語音。轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/137950.html
標籤:非技術區
