語(yǔ)音合成(Text To Speech)已經(jīng)在可懂度、自然度等方面取得了較好的效果,被廣泛應(yīng)用于銀行叫號(hào)、機(jī)場(chǎng)廣播、地圖導(dǎo)航等多個(gè)領(lǐng)域。而人的語(yǔ)音交流不僅包含著基本的文字信息,還承載著大量豐富的情感信息,這就對(duì)語(yǔ)音合成提出了更高的要求。
極限元專(zhuān)門(mén)從事智能語(yǔ)音技術(shù),擁有完全自主知識(shí)產(chǎn)權(quán)。其語(yǔ)音合成采用世界先進(jìn)的數(shù)據(jù)驅(qū)動(dòng)技術(shù),利用精心設(shè)計(jì)的語(yǔ)音語(yǔ)料庫(kù)進(jìn)行聲學(xué)模型和文本處理模型的訓(xùn)練,得到的模型深度挖掘了語(yǔ)音語(yǔ)言特性,從而能夠合成接近真人發(fā)音的語(yǔ)音,合成的語(yǔ)音清晰、自然、親切、具有高表現(xiàn)力。
韻律是合成語(yǔ)音是否具有高自然度的關(guān)鍵所在。極限元語(yǔ)音合成對(duì)輸入文本進(jìn)行韻律分析預(yù)測(cè),其中包括韻律詞、韻律短語(yǔ)邊界劃分,詞重音的分布,各個(gè)語(yǔ)音單元的基頻、時(shí)長(zhǎng)等。這樣合成的語(yǔ)音清晰明朗,親切自然,接近真人發(fā)音。目前,極限元已為百度、騰訊、搜狗、奇虎360等眾多客戶(hù)服務(wù),建立了長(zhǎng)期穩(wěn)定的合作關(guān)系。
極限元語(yǔ)音合成技術(shù),合成語(yǔ)音效果媲美真人發(fā)聲,專(zhuān)業(yè)MOS分可達(dá)4.0,為了市場(chǎng)發(fā)展需要,極限元的語(yǔ)音合成技術(shù)全面支持多方言、多語(yǔ)種、多音色的選擇,目前標(biāo)配的有甜美女生和渾厚男生,針對(duì)用戶(hù)的不同應(yīng)用場(chǎng)景和個(gè)性化的音色需求,提供全方位的語(yǔ)音合成定制化服務(wù),例如:明星的聲音、兒童的聲音以及某個(gè)地區(qū)方言。
極限元語(yǔ)音合成定制化支持錄音人選型、錄音采集、語(yǔ)料標(biāo)注,還能實(shí)現(xiàn)模型迭代訓(xùn)練、合成引擎優(yōu)化,支持在線(xiàn)、離線(xiàn)模式,適用于多種平臺(tái),可應(yīng)用于多個(gè)領(lǐng)域。如:
呼叫中心行業(yè)中的應(yīng)用
擁有大量客戶(hù)群體的行業(yè)呼叫中心,如電信、銀行、證券、保險(xiǎn)、房地產(chǎn)、家電、運(yùn)輸、互聯(lián)網(wǎng)、公共服務(wù)機(jī)構(gòu),語(yǔ)音合成技術(shù)能夠以有限的資源占用,將文字信息轉(zhuǎn)化成連續(xù)語(yǔ)音,合成語(yǔ)音自然、流暢。對(duì)于呼叫中心而言,無(wú)需對(duì)大量的信息進(jìn)行錄音,極大地節(jié)省了工作量和存儲(chǔ)空間,同時(shí)根據(jù)呼叫中心需求,語(yǔ)音合成技術(shù)還能提供個(gè)性化語(yǔ)音合成服務(wù),為呼叫中心提供高質(zhì)量的服務(wù)需求。
車(chē)載導(dǎo)航上的應(yīng)用
智能化、人性化的車(chē)載導(dǎo)航已經(jīng)成為一個(gè)重要的發(fā)展趨勢(shì),車(chē)載導(dǎo)航產(chǎn)品中的語(yǔ)音輸出用合成技術(shù)將需要同用戶(hù)交互的信息轉(zhuǎn)化成語(yǔ)音,如:道路信息,駕駛導(dǎo)航信息,POI信息,實(shí)時(shí)路況等,使用戶(hù)通過(guò)語(yǔ)音獲取信息,方便駕駛員解放雙手和眼睛,同時(shí)提高駕駛安全性。
智能機(jī)器人的應(yīng)用
銀行、醫(yī)院、教育等行業(yè)的商用機(jī)器人逐漸成熟,極限元語(yǔ)音合成可以為機(jī)器人合成個(gè)性化語(yǔ)音,比如銀行、醫(yī)院的機(jī)器人語(yǔ)音需要甜美親切的,而教育行業(yè)主要針對(duì)孩子的,機(jī)器人的語(yǔ)音需要呆萌可愛(ài)的童音。
智能家居的應(yīng)用
在家居場(chǎng)景中,主要圍繞著智能電視、智能音箱展開(kāi),解決用戶(hù)需求,如搜索影片、歌曲、簡(jiǎn)單交互、應(yīng)用調(diào)取等,極限元語(yǔ)音合成定制化能夠根據(jù)用戶(hù)需求,定制合成語(yǔ)音,如明星的聲音。
極限元語(yǔ)音合成已達(dá)到流暢、連貫、自然、逼近真人發(fā)聲的語(yǔ)音合成效果,無(wú)論是地圖導(dǎo)航、機(jī)場(chǎng)廣播的甜美女生,新聞朗讀的渾厚男生,還是機(jī)器人的可愛(ài)童聲,極限元的語(yǔ)音合成技術(shù)能夠滿(mǎn)足企業(yè)需求,實(shí)現(xiàn)個(gè)性化高端定制,讓大家聽(tīng)到機(jī)器的聲音娓娓動(dòng)聽(tīng),讓未來(lái)交互場(chǎng)景更加豐富、個(gè)性化。