總體技術(shù)要求:
TTS系統(tǒng)支持熱備運行,,能夠?qū)崿F(xiàn)故障切換,具備雙機負(fù)載均衡機制,。
功能性要求
支持中文普通話,、廣東話及新疆維語等風(fēng)格語音播報,具備多語種引擎架構(gòu),,方便第三方開發(fā)商通過API或者M(jìn)RCP進(jìn)行調(diào)用,;
能夠進(jìn)行中/英文混合文本的語音合成,,其中,中文語音合成為標(biāo)準(zhǔn)普通話,,合成語音連續(xù),、可懂、自然,,接近普通人說話標(biāo)準(zhǔn),;
支持多字符集文本輸入,如GB2312,、GB18030,、GBK、Unicode和UTF-8等,;
支持SSML和S3ML標(biāo)注文本與格式輸入,;
支持多種語音格式的輸出;
支持語音參數(shù)的調(diào)節(jié)控制,,包括:語速,、音量和語調(diào);
具有完善的管理平臺,,能夠監(jiān)控TTS服務(wù)器的運行情況,,可以實時獲取系統(tǒng)運行壓力及并發(fā)數(shù)等,對異常事件具有報警機制和必要的處理措施,;
系統(tǒng)必須提供自定義資源,,使得合成引擎具有更好的個性化定制和優(yōu)化能力,自定義詞庫允許用戶添加刪除中文和英文的詞組,,定義詞組的發(fā)音方式和音標(biāo),,其中發(fā)音方式用以指定特定詞組發(fā)音方式,比如指定某個英文詞組是否按照字母來朗讀,。而對音標(biāo)的自定義可以糾正極少數(shù)多音字(詞)音標(biāo)處理錯誤的現(xiàn)象,;
支持背景音和穿插在合成語音中的錄音文件;
支持文本過濾功能,,能夠?qū)χ付ǖ奈谋?,比如敏感詞語進(jìn)行過濾處理;
提供對合成效果優(yōu)化的解決方案,,能夠針對實際應(yīng)用環(huán)境,,提供合成效果優(yōu)化方案;
支持Microsoft Windows/Unix/Linux操作系統(tǒng),;
必須能夠和主流IVR系統(tǒng)無縫集成,,且對第三方產(chǎn)品在其平臺上的嵌入具有較好的支持,必須要能夠得到較好的支持;
語音合成系統(tǒng)可以多種不同的方式來完成文字到語音的轉(zhuǎn)換,,包括本地調(diào)用,、網(wǎng)絡(luò)調(diào)用、離線合成,;
支持多語種引擎的方便掛接和升級,;
可通過標(biāo)準(zhǔn)的API和MRCP開發(fā)接口進(jìn)行完整的系統(tǒng)功能開發(fā),以及與現(xiàn)有語音系統(tǒng)的集成工作,,要求對如何與語音系統(tǒng)進(jìn)行無縫銜接進(jìn)行完整的闡述,,提供切實可行的實施方案。
效率性要求
合成效率:在90個并發(fā)請求的情況下,,對50個漢字進(jìn)行動態(tài)合成的時間不超過1.5秒,,最大響應(yīng)時間小于6秒。120個并發(fā)請求的情況下,,單筆合成時間不超過2秒,;
容錯性和可靠性:支持服務(wù)器集群部署,即使個別服務(wù)器失效,,也不會造成整個系統(tǒng)崩潰,停止服務(wù),;
維護(hù)方便:可以關(guān)閉一臺TTS服務(wù)器進(jìn)行維修,,而對整個系統(tǒng)的功能沒有影響;
可伸縮性:隨著呼叫量的增加,,可增加TTS服務(wù)器和應(yīng)用的數(shù)量,,無須停止任何運行著的應(yīng)用程序或關(guān)閉IVR系統(tǒng);
擴展能力:當(dāng)應(yīng)用系統(tǒng)需要擴容時,,客戶端服務(wù)器不需要做任何的修改,,只需要在網(wǎng)段內(nèi)添加一臺新的語音合成服務(wù)器,并且自動啟動服務(wù),;
使用方便:在對業(yè)務(wù)系統(tǒng)進(jìn)行更新時,,只需按照日常習(xí)慣進(jìn)行文字的更新即可,不必進(jìn)行特使的修改或編程即可得到比較理想的語音效果,。
|